huagangwang
lewis@110
采纳率0%
2017-03-09 05:54 阅读 3.5k

python requests.get(url) 采集网页中文乱码问题。

1

图片说明

如图:这个编码怎么解决,

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享

6条回答 默认 最新

  • dcxy0 Q544471255 2017-03-09 06:00

    看下编码是不是gbk,设置一下编码,

     http://cn.python-requests.org/zh_CN/latest/
    
    点赞 评论 复制链接分享
  • Tiger_Zhao Tiger_Zhao 2017-03-09 06:49

    不要动不动就是“乱码”,这是就是HTML中合法的转义。
    苏表示这个字符的 Unicode 就是 33487,对应字符就是

    点赞 评论 复制链接分享
  • lsttoy 乐扣老师lekkoliu 2017-03-09 09:28

    被/弄成转义代码了而已。解决方法就是在苏和斜杠中间加个空格 或者使用转义码来解决。望采纳。

    点赞 评论 复制链接分享
  • u012582664 魔亦有道 2017-03-12 02:06

    read()后加解码即可。decode(utf-8)解码为utf-8格式,有的html也为gbk格式

    点赞 评论 复制链接分享
  • huagangwang lewis@110 2017-03-23 05:23

    我已经搞定了,,,,,

    点赞 评论 复制链接分享
  • zhuzi9 多米学算法 2021-02-08 21:49

    如何搞定的?我也遇见这个问题了

    点赞 评论 复制链接分享