u012194696
O-A-A
采纳率33.3%
2017-06-18 08:24 浏览 1.8k

Python爬取网页requests乱码

之前有在裁判文书上爬取数据,这段时间重新运行爬虫后发现无法获取网页数据,找了一下发现requests网页源码返回的是乱码

(如下截取一部分返回的数据:<meta id="JLyKZlWgYjpTkAsEt9LnA" )

不知道是不是网站对网页内容进行了加密,请问如何解决这个问题?谢谢!

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享
  • 邀请回答

6条回答 默认 最新

  • oyljerry oyljerry 2017-06-18 09:11

    像是base64编码。还有可能加密了。

    点赞 1 评论 复制链接分享
  • u012194696 O-A-A 2017-06-18 08:28

    图片说明
    乱码如上

    点赞 评论 复制链接分享
  • dcxy0 Q544471255 2017-06-18 10:51

    数据加密了把。。。。。。

    点赞 评论 复制链接分享
  • qq_39248703 以王姓自居 2017-06-21 00:11

    是不是编码的问题 ? 你设置成request.encoding = request.apprent_encoding 编码就应该不会错了。

    点赞 评论 复制链接分享
  • CThreeStone CThreeStone 2017-08-10 03:07

    解决了吗?我也遇到了

    点赞 评论 复制链接分享
  • Jimmy_Tsai Jimmy_Tsai 2018-11-04 05:07

    加上encoding = '......'

    点赞 评论 复制链接分享

相关推荐