m0_67923054 2022-03-15 19:28 采纳率: 0%
浏览 1033

Python爬虫爬出来为none

初学,在爬某网站评论内容,遇到了none,自认为定位方法都是正确的,就是爬不出来

img

img

  • 写回答

4条回答 默认 最新

  • 关注

    你comment 获取的是"数据加载中..."就说明了你这个网页中的内容是通过js代码读取外部json数据来动态更新的。
    requests只能获取网页的静态源代码(静态源代码中就只有"数据加载中..."),动态更新的内容取不到。
    对于动态更新的内容要用selenium 来爬取。

    或者是通过F12控制台分析页面数据加载的链接,找到真正json数据的地址进行爬取。

    在页面上点击右键,右键菜单中选 "查看网页源代码"。

    img


    这样看到的才是网页的静态源代码。
    如果这个网页的静态源代码中有你需要爬取的内容,就说明该页面没有动态内容,可以用requests爬取。
    否则就说明该页面的内容是动态更新的,要用selenium 来爬取.

    如有帮助,请点击我的回答下方的【采纳该答案】按钮帮忙采纳下,谢谢!

    img

    评论 编辑记录

报告相同问题?

问题事件

  • 修改了问题 3月15日
  • 创建了问题 3月15日