m0_57965808 2021-10-07 17:50 采纳率: 90.9%
浏览 50
已结题

Python如何利用selenium获取页面文字

问题如题,想爬取的页面为百度文库,他的文字形式为:

img

想知道该怎么写代码。

  • 写回答

1条回答 默认 最新

  • 没头发的米糊 2021-10-07 18:55
    关注

    可以看到,这些p标签拥有固定的class:“reader-word-layer”,就可以使用driver.find_elements_by_class_name("reader-word-layer")获取到装有这些标签的容器。
    此后遍历容器,使用.getText()方法即可获取到这些标签内的文本,然后将它们拼接成字符串即可。
    相关其他问题欢迎私信我!

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 10月15日
  • 已采纳回答 10月7日
  • 修改了问题 10月7日
  • 创建了问题 10月7日

悬赏问题

  • ¥20 机器学习能否像多层线性模型一样处理嵌套数据
  • ¥20 西门子S7-Graph,S7-300,梯形图
  • ¥50 用易语言http 访问不了网页
  • ¥50 safari浏览器fetch提交数据后数据丢失问题
  • ¥15 matlab不知道怎么改,求解答!!
  • ¥15 永磁直线电机的电流环pi调不出来
  • ¥15 用stata实现聚类的代码
  • ¥15 请问paddlehub能支持移动端开发吗?在Android studio上该如何部署?
  • ¥20 docker里部署springboot项目,访问不到扬声器
  • ¥15 netty整合springboot之后自动重连失效