m0_57965808 2021-10-07 17:50 采纳率: 91.2%
浏览 51
已结题

Python如何利用selenium获取页面文字

问题如题,想爬取的页面为百度文库,他的文字形式为:

img

想知道该怎么写代码。

  • 写回答

1条回答 默认 最新

  • 没头发的米糊 2021-10-07 18:55
    关注

    可以看到,这些p标签拥有固定的class:“reader-word-layer”,就可以使用driver.find_elements_by_class_name("reader-word-layer")获取到装有这些标签的容器。
    此后遍历容器,使用.getText()方法即可获取到这些标签内的文本,然后将它们拼接成字符串即可。
    相关其他问题欢迎私信我!

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 10月15日
  • 已采纳回答 10月7日
  • 修改了问题 10月7日
  • 创建了问题 10月7日

悬赏问题

  • ¥15 乌班图ip地址配置及远程SSH
  • ¥15 怎么让点阵屏显示静态爱心,用keiluVision5写出让点阵屏显示静态爱心的代码,越快越好
  • ¥15 PSPICE制作一个加法器
  • ¥15 javaweb项目无法正常跳转
  • ¥15 VMBox虚拟机无法访问
  • ¥15 skd显示找不到头文件
  • ¥15 机器视觉中图片中长度与真实长度的关系
  • ¥15 fastreport table 怎么只让每页的最下面和最顶部有横线
  • ¥15 java 的protected权限 ,问题在注释里
  • ¥15 这个是哪里有问题啊?