weixin_41905832 2022-08-30 09:19 采纳率: 100%
浏览 34
已结题

爬虫如何获取未展开的div标签

爬虫获取的网页源码如图

img

id="wrapper"的div标签无法展开,无法获取里面的内容,用selenium感觉效率太低了,能有什么办法吗?

实际div展开如下图

img

  • 写回答

5条回答 默认 最新

  • honestman_ 2022-08-30 10:03
    关注

    因为div里的内容,使用过ajax加载的,所以爬虫获取的网页源码是没有里面的内容的,这种数据相对来说方便一点,直接可以抓包拿到相应的ajax请求,然后直接reqeusts模块发送请求就可以拿到数据了,具体步骤:

    1. 打开浏览器抓包页面,点击网络(network)-> XHR:

      img

    2. 刷新页面,在刷新的ajax响应里面找到你需要的数据
    3. requests模拟发送此条请求就可以了
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(4条)

报告相同问题?

问题事件

  • 系统已结题 9月8日
  • 已采纳回答 8月31日
  • 创建了问题 8月30日

悬赏问题

  • ¥16 Qphython 用xlrd读取excel报错
  • ¥15 单片机学习顺序问题!!
  • ¥15 ikuai客户端多拨vpn,重启总是有个别重拨不上
  • ¥20 关于#anlogic#sdram#的问题,如何解决?(关键词-performance)
  • ¥15 相敏解调 matlab
  • ¥15 求lingo代码和思路
  • ¥15 公交车和无人机协同运输
  • ¥15 stm32代码移植没反应
  • ¥15 matlab基于pde算法图像修复,为什么只能对示例图像有效
  • ¥100 连续两帧图像高速减法