本人用BeautifulSoup爬取一个网站内容,但是操作中发现,网页下滑会加载新的内容,致使爬取信息不完整。想请问如何可以解决?
代码如下:
关于爬虫爬取动态网站的问题
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
- CSDN专家-天际的海浪 2022-04-17 19:29关注
你这个网页中的内容通过 js代码读取外部json数据来动态更新的。
可以通过F12控制台分析页面数据加载的链接,找到真正json数据的地址进行爬取。或者参考selenium滚动到页面底部的几种解决方案
selenium滚动到页面底部的几种解决方案 - mik99 - 博客园 在用selenium获取页面时,很多时候需要将滚动条拖到页面底部,下面总结了几种方法. 目录 location_once_scrolled_into_view ActionChains js方法scr https://www.cnblogs.com/mik-hello/p/15476839.html让页面滚动底部加载了更多数据之后再获取
如有帮助,请点击我的回答下方的【采纳该答案】按钮帮忙采纳下,谢谢!
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报 编辑记录
悬赏问题
- ¥15 通联支付网上收银统一下单接口
- ¥15 angular有偿编写,
- ¥15 VB.NET使用保存对话框保存图片?
- ¥15 centos7系统下abinit安装时make出错
- ¥15 hbuildex运行微信小程序报错
- ¥15 关于#python#的问题:我知道这个问题对你们来说肯定so easy
- ¥15 wpf datagrid如何实现多层表头
- ¥15 为啥画版图在Run DRC会出现Connect Error?可我Calibre的hostname和计算机的hostname已经设置成一样的了。
- ¥20 网站后台使用极速模式非常的卡
- ¥20 Keil uVision5创建project没反应