python requests.get(url) 采集网页中文乱码问题。 1C

图片说明

如图:这个编码怎么解决,

5个回答

看下编码是不是gbk,设置一下编码,

 http://cn.python-requests.org/zh_CN/latest/

不要动不动就是“乱码”,这是就是HTML中合法的转义。
苏表示这个字符的 Unicode 就是 33487,对应字符就是

被/弄成转义代码了而已。解决方法就是在苏和斜杠中间加个空格 或者使用转义码来解决。望采纳。

read()后加解码即可。decode(utf-8)解码为utf-8格式,有的html也为gbk格式

我已经搞定了,,,,,

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问