O-A-A 2017-06-18 00:24 采纳率: 0%
浏览 1843

Python爬取网页requests乱码

之前有在裁判文书上爬取数据,这段时间重新运行爬虫后发现无法获取网页数据,找了一下发现requests网页源码返回的是乱码

(如下截取一部分返回的数据:<meta id="JLyKZlWgYjpTkAsEt9LnA" )

不知道是不是网站对网页内容进行了加密,请问如何解决这个问题?谢谢!

  • 写回答

6条回答 默认 最新

  • oyljerry 2017-06-18 01:11
    关注

    像是base64编码。还有可能加密了。

    评论
  • O-A-A 2017-06-18 00:28
    关注

    图片说明
    乱码如上

    评论
  • JPF1024 2017-06-18 02:51
    关注

    数据加密了把。。。。。。

    评论
  • 余晖下的少爷 2017-06-20 16:11
    关注

    是不是编码的问题 ? 你设置成request.encoding = request.apprent_encoding 编码就应该不会错了。

    评论
  • .*?.*? 2017-08-09 19:07
    关注

    解决了吗?我也遇到了

    评论
  • Jimmy_Tsai 2018-11-03 21:07
    关注

    加上encoding = '......'

    评论
编辑
预览

报告相同问题?

手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部