Python如何利用selenium获取页面文字

问题如题，想爬取的页面为百度文库，他的文字形式为：

想知道该怎么写代码。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
没头发的米糊 2021-10-07 18:55
关注
可以看到，这些p标签拥有固定的class：“reader-word-layer”，就可以使用driver.find_elements_by_class_name("reader-word-layer")获取到装有这些标签的容器。
此后遍历容器，使用.getText()方法即可获取到这些标签内的文本，然后将它们拼接成字符串即可。
相关其他问题欢迎私信我！

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python如何利用selenium获取页面文字 python selenium
2021-10-07 17:50

回答 1 已采纳可以看到，这些p标签拥有固定的class：“reader-word-layer”，就可以使用driver.find_elements_by_class_name("reader-word-layer"
python3+selenium如何获取页面的加载时间或者时间戳 python selenium 测试工具
2022-05-23 09:55

回答 1 已采纳 from datetime import datetime ##获取页面加载时间 a = datetime.now() url='http://192.168.1.199/' x=webdrive
python+selenium+xpath如何定位网页table表格中的数据 python selenium 有问必答爬虫
2022-02-25 12:44

回答 2 已采纳使用last()定位最后一个tr节点，再用索引获取。示例： from lxml import etree with open('a.html','r',encoding='utf-8') as f:
python利用selenium获取网页head中的title
2022-07-01 11:11

Autismmei的博客工作中有批量获取网页head中title的应用场景，实践中遇到了一些问题，以此记录一下。通过检查发现网页的head中的title确实有文本，但是使用selenium的driver.title提取到了空字符串’’
Python利用selenium实现爬虫 python
2022-11-17 13:55

回答 2 已采纳很奇怪的问题，而且这个99版本也不是很老，你可以更新一下浏览器，然后下载更新后版本对应的driver驱动版本呀，不一定要降低浏览器版本。试试🐵
python selenium+pytest获取元素文本信息 python selenium 测试工具
2022-08-29 00:20

回答 3 已采纳是那行报错？？？说无法定位元素
如何利用python selenium 判断某个网页是否加载完毕 python
2019-03-16 22:44

回答 5 已采纳只能说判断网页中是否存在某个元素，因为网页加载完毕在ajax时代已经变得模糊了。举例来说，weibo可以不断向下拖动加载，什么时候算加载完？在网页里的时钟，不断更新，什么时候加载完？网
python selenium 获取接口数据的实现
2021-01-21 15:19

python selenium 获取接口数据。 selenium没有直接提供查询的函数，但是可以通过webdriver提供的API查询，使用的函数是Network.getResponseBody webdriver提供的API文档：...
python +selenium 如何获取下拉列表，默认选中值 python selenium
2021-10-27 10:36

回答 1 已采纳 Select(self.web.find_element_by_name('day_num')).all_selected_options[0].text
求助如何利用Python +selenium实现长网页截图 python
2019-04-07 23:57

回答 3 已采纳 https://blog.csdn.net/fnms88/article/details/82926051 直接代码如下： import autoit import unittest im
python+selenium 断言怎么判断 python selenium
2021-07-15 16:19

回答 2 已采纳就是判断下弹出框中的某些元素存不存在是吧？参考下：https://www.cnblogs.com/yoyoketang/p/6493005.html
Python+selenium 获取浏览器窗口坐标、句柄的方法
2020-09-20 01:26

今天小编就为大家分享一篇Python+selenium 获取浏览器窗口坐标、句柄的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
selenium获取的网页文本怎么装入excel中 python 有问必答
2021-07-07 11:15

回答 1 已采纳参考一下：https://blog.csdn.net/u013250071/article/details/81911434 如果对你有帮助，可以点击我这个回答右上方的【采纳】按钮，给我个采纳吗，谢谢
Python+selenium点击网页上指定坐标的实例
2020-09-19 03:46

今天小编就为大家分享一篇Python+selenium点击网页上指定坐标的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
Python Selenium自动化获取页面信息的方法
2020-09-16 08:42

主要介绍了Python Selenium自动化获取页面信息的方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 10月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月7日

悬赏问题

¥20 机器学习能否像多层线性模型一样处理嵌套数据
¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页
¥50 safari浏览器fetch提交数据后数据丢失问题
¥15 matlab不知道怎么改，求解答！！
¥15 永磁直线电机的电流环pi调不出来
¥15 用stata实现聚类的代码
¥15 请问paddlehub能支持移动端开发吗？在Android studio上该如何部署？
¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效

Python如何利用selenium获取页面文字

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新