mahuolong
mahuolong
采纳率0%
2015-01-06 13:14 阅读 10.3k

Python 爬虫为什么只爬取到一个html页中的部分内容。

在用Python中urlopen和read直接获取到一个网页的HTML,为什么内容与通过浏览器的
查看网页源码的方式显示内容不一样呢,获取到的HTML只有原HTML部分内容。

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享

3条回答 默认 最新

  • oyljerry oyljerry 2015-01-06 13:39

    页面内容是异步加载的
    你访问的的是开始部分。
    浏览器有进行后续处理

    点赞 评论 复制链接分享
  • oyljerry oyljerry 2015-01-06 13:40

    你可以使用selenium,它可以模拟浏览器的webdriver

    点赞 评论 复制链接分享
  • mahuolong mahuolong 2015-01-09 02:10

    谢谢各位!我知道了。

    点赞 评论 复制链接分享

相关推荐