m0_46610985
极光Blink
采纳率0%
2021-03-02 00:19

爬虫,爬取的网页源码为啥中间一部分缺失

 最需要的那部分缺失了,因为页面是异步加载返回吗?

 • 点赞
 • 写回答
 • 关注问题
 • 收藏
 • 复制链接分享
 • 邀请回答

1条回答

 • technologist_04 CSDN技术专家团—麒麟奇 1月前

  这部分html内容是用脚本运行时写入的,可以使用chrome开发者工具找到对应的脚本。

  下图是在chrome开发者工具中断点的方法,添加断点后,刷新网页可以找到对应的脚本

   

  1. 如果内容来自服务端其他的url,可从这个url获取内容

  2. 如果内容在当前网页的脚本中,可以通过正则re分析获取内容

  点赞 1 评论 复制链接分享

为你推荐