||洛月 2020-10-12 08:35 采纳率: 100%
浏览 1135
已采纳

网页爬虫,F12可以看到的内容,但爬出来的源码里没有

想要做一个自动爬取公司内网word的一个工具,但是在爬取日期的时候,发现爬出来的源码缺失了很多信息,跟F12看到的不一样。

尝试用了xpath和正则表达式解析,解析出来的全是空列表。

搜了很多,基本都说是异步加载的问题。
但查Network里看到的是第一条出来的,Doc里的内容。
图片说明

所以应该不是异步加载的关系。
图片说明
这是爬出来的源码,里面只有一些标题,并不包含实际内容
——————————

卡着好几天了,实在没辙了,哪位大佬有啥办法没。

  • 写回答

2条回答 默认 最新

  • weixin_39411955 2020-10-12 09:39
    关注

    把浏览器 源码,跟爬取的源码 全部贴出来

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)
编辑
预览

报告相同问题?

手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部