urllib2获取网页信息时的中文编码

请问用urllib2.open()获取网页信息的时候,中文不能显示,怎么解决?网上搜索了一些没搞定,请教一下
out[4] =
' \n'

都是这种显示,不知道怎么解决,谢谢

2个回答

[color=red]首先, 道个歉. 原因是昨天手快, 敲错了. 这个字体是: utf8的. 不是gbk的.[/color]

然后, 终端字符集是和系统相关的.

在bsd下面, csh, 修改 .cshrc:
setenv LANG zh_CN.UTF-8

在linux下面, bash, 修改 .bashrc:
export LANG="zh_CN.UTF-8"

在mac下面, bash, 修改 .bash_profile:
export LANG="zh_CN.UTF-8"

在win下面, 抱歉, 我也不知道.
如果你是用的win, 那么, 你这样子试试看: print out[4].decode('utf-8').encode('gbk')

这个编码是正确的,看着是gbk编码。估计你是终端设置的字符集不对。

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问