m0_46610985
极光Blink
采纳率0%
2021-03-02 00:19

爬虫,爬取的网页源码为啥中间一部分缺失

 最需要的那部分缺失了,因为页面是异步加载返回吗?

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享
  • 邀请回答

1条回答

  • technologist_04 CSDN技术专家团—麒麟奇 1月前

    这部分html内容是用脚本运行时写入的,可以使用chrome开发者工具找到对应的脚本。

    下图是在chrome开发者工具中断点的方法,添加断点后,刷新网页可以找到对应的脚本

     

    1. 如果内容来自服务端其他的url,可从这个url获取内容

    2. 如果内容在当前网页的脚本中,可以通过正则re分析获取内容

    点赞 1 评论 复制链接分享

为你推荐