selenium爬取数据异常

问题遇到的现象和发生背景

selenium爬取网站数据，通过识别”id“获取text，由于页面较长，页面数据没有完全显示，结果只有显示的数据爬取的到，未显示的值爬取不到，如何解决？

问题相关代码，请勿粘贴截图

def downloaddata(num):
landdata = {}
lablename = {"地块名称":"dkmc", "四至范围":"szfw", "出让人":"crr", "出让方式":"crfs", "所属区县":"ssqx", "土地用途":"tdtype", "出让面积":"crmj", "容积率":"rjl", "出让状态":"blockstate", "竞得价":"jdj", "竞得日期":"jdrq", "竞得人":"jdr"}
url = 'http://www.shtdsc.com/2016/tdjy/dkxx/crdk/?id=' + num
browser = webdriver.Firefox()
browser.get(url)
time.sleep(2)
for key in lablename.keys():
landdata[key] = browser.find_element(by='id', value=lablename[key]).text

运行结果及报错内容

浏览器页面显示额范围是这些：

然后函数执行的打印结果只如下这几个值：
{'地块名称': '', '四至范围': '', '出让人': '上海市金山区规划和自然资源局', '出让方式': '挂牌', '所属区县': '金山区', '土地用途': '工业用地', '出让面积': '162201.8', '容积率': '2.0', '出让状态': '成交', '竞得价': '', '竞得日期': '', '竞得人': ''}

浏览器页面不显示的地方，数据的值就爬取不到
这是为什么呀？

我的解答思路和尝试过的方法

我想要达到的结果

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
三喂树屋 2022-05-03 21:37
关注
数据在哪就在哪页爬，页面不显示的一般元素没有加载，你自然取不到啊

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

selenium爬取数据异常 python selenium 爬虫
2022-05-03 21:12

回答 1 已采纳数据在哪就在哪页爬，页面不显示的一般元素没有加载，你自然取不到啊
使用selenium爬取数据时，数据没展开提取不到怎么办？ python
2021-03-07 15:54

回答 2 已采纳两个方法一个是找到后端接口，直接请求后端接口另一个是操作selenium点击加载
【python】selenium爬取含企查查中文的网址报405问题 chrome python selenium
2021-09-23 10:04

回答 2 已采纳先进首页，再跳转
Python实战：用Selenium爬取网页数据
2023-04-30 17:27

青春不朽512的博客 Selenium是一个自动化测试工具，它可以...与常用的BeautifulSoup、requests等爬虫库不同，Selenium可以处理JavaScript动态加载的内容，因此对于那些需要模拟用户交互才能获取的数据，Selenium是一个非常合适的选择。
Python selenium的爬虫无法完整爬取整个页面的内容 python selenium 爬虫
2021-10-24 09:44

回答 1 已采纳爬取内容不完整，应该是文档的更多内容，要往下滑动页面才会出现这个不太清楚，应该不是什么反爬，就是类似于中途给你弹出个广告，要具体分析怎么弄VIP内容肯定是需要你的账号是VIP才能看得到的，与selen
selenium爬取房源网站 python selenium 有问必答
2022-05-10 21:17

回答 3 已采纳请提供报错信息，从报错行查找原因。
selenium模拟登陆+爬取数据 python selenium 爬虫
2022-06-15 16:41

回答 2 已采纳 if name == 'main':输入用户名的地方少了个点parse_html中，node_list的xpath应该是[@id="datatable-1"]/tbody，你写的xpath是一行的xp
selenium实战之Python+Selenium爬取商品数据
2023-11-23 18:15

@半良人的博客实战目标：爬取商品信息，包括商品的价格、主图、详情图。
用selenium爬取淘宝多页数据时，只是重复打印一页 python
2021-04-06 22:14

回答 5 已采纳如果没看错的话，您在data函数中做了3次循环，是想爬前三页的数据吗？如果是的话，问题就出在soup上，您的soup是第一页的内容，不管循环多少次，都是在对第一页进行操作
selenium爬取淘宝翻页不成功，有大佬帮下忙吗 python
2021-04-16 18:12

回答 4 已采纳 data中不是循环了两次吗？所以最多爬取两页的数据。有一个问题， browser.get(f"https://s.taobao.com/search?q={value}&s={b}") b +=
selenium+pyquery爬取房源数据 python selenium 有问必答
2022-05-10 16:02

回答 4 已采纳题主可参考用requests+pyquery获取房源数据的例子：https://blog.csdn.net/weixin_44530636/article/details/95173649
python-selenium爬取页面数据
2022-10-24 15:22

风一吹你就要走的博客现在只用Selenium就可以完成 mitmproxy + Selenium 的组合才能完成的操作~~~Selenium获取Network，Selenium获取XHR数据，Selenium获取Network数据，很详细。...2、python selenium 操作需要获取页面中请求的响应数据。
用python爬取数据出错 python selenium 有问必答爬虫
2022-01-06 18:29

回答 2 已采纳那不很明显吗, 底层少包, 用pip安装 openpyxl
Python实战使用Selenium爬取网页数据
2024-01-02 15:41

小兮说测试的博客网络爬虫是Python编程中一个非常有用的技巧，它可以让您自动获取网页上的数据。在本文中，我们将介绍如何使用Selenium库来爬取网页数据，特别是那些需要模拟用户交互的动态网页。
selenium爬取示例
2021-10-05 22:56

give it a try~的博客 selenium自动化爬取信息获取cookie爬取信息文件操作xlsx文件系列csv文件系列xls文件系列html节点获取正则提取其他知识异常处理模块loginexcept_solve保存信息保存图片保存景区基本信息保存景区评论依次爬取景点及...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月3日

悬赏问题

¥15 微信会员卡等级和折扣规则
¥15 微信公众平台自制会员卡可以通过收款码收款码收款进行自动积分吗
¥15 随身WiFi网络灯亮但是没有网络，如何解决？
¥15 gdf格式的脑电数据如何处理matlab
¥20 重新写的代码替换了之后运行hbuliderx就这样了
¥100 监控抖音用户作品更新可以微信公众号提醒
¥15 UE5 如何可以不渲染HDRIBackdrop背景
¥70 2048小游戏毕设项目
¥20 mysql架构，按照姓名分表
¥15 MATLAB实现区间[a,b]上的Gauss-Legendre积分