urllib2获取网页信息时的中文编码

请问用urllib2.open()获取网页信息的时候，中文不能显示，怎么解决？网上搜索了一些没搞定，请教一下
out[4] =
' \n'

都是这种显示，不知道怎么解决，谢谢

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
RyanPoy 2010-09-10 18:15
关注
[color=red]首先, 道个歉. 原因是昨天手快, 敲错了. 这个字体是: utf8的. 不是gbk的.[/color]

然后, 终端字符集是和系统相关的.

在bsd下面, csh, 修改 .cshrc:
setenv LANG zh_CN.UTF-8

在linux下面, bash, 修改 .bashrc:
export LANG="zh_CN.UTF-8"

在mac下面, bash, 修改 .bash_profile:
export LANG="zh_CN.UTF-8"

在win下面, 抱歉, 我也不知道.
如果你是用的win, 那么, 你这样子试试看: print out[4].decode('utf-8').encode('gbk')

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

urllib2获取网页信息时的中文编码 python
2010-09-06 10:07

回答 2 已采纳 [color=red]首先, 道个歉. 原因是昨天手快, 敲错了. 这个字体是: utf8的. 不是gbk的.[/color] 然后, 终端字符集是和系统相关的. 在bsd下面, csh
Python爬虫获取经纬度 python
2022-12-24 18:48

回答 1 已采纳从你提供的代码来看，首先爬取的页面是从上海的充电桩的信息，然后用 pyquery 来解析页面，得到了一个包含了所有充电桩信息的 items 列表。在循环中，解析了每个充电桩的名称和位置，并将它们分别放
python爬取并下载的文件为什么是空白且加载不出来？ python
2021-08-08 11:16

回答 2 已采纳你只是爬取了html网页，，怎么能让你运行人家的网页呢你说的加载不出来那是肯定的这个样子应该你只是爬了个外壳，css和js都不能用了，所以背景是白的，按钮都是没有样式的如果明白了，点击右上角给个采纳哦
python通过urllib2获取带有中文参数url内容的方法
2020-09-22 08:44

主要介绍了python通过urllib2获取带有中文参数url内容的方法,涉及Python中文编码的技巧,具有一定参考借鉴价值,需要的朋友可以参考下
python爬虫检索超出范围报错 python 爬虫
2022-09-08 16:31

回答 3 已采纳你输出con，输出的con是空列表，说明你节点的定位是有问题的，直接去开发者面板复制定位路径
关于python模拟登陆问题 http python 爬虫
2022-12-13 11:44

回答 2 已采纳看看网址能不能打开吧～这书很多案例提供的网址都失效了
用Python爬取一个网页，向下滚动会不断生成div，想要爬取这些div但爬取下来只有个loading python 爬虫
2022-03-28 22:27

回答 2 已采纳阿这.你这个URL所需要的电影数据不是写在接口里嘛?????打开F12开发者工具.刷新页面.选择XHR.就能看到这个网站数据返回是JSON接口https://api.jackeriss.com/api
python urlopen 乱码_Python 2.7.3 urllib2.urlopen 获取网页出现乱码解决方案
2020-12-16 00:50

weixin_39646831的博客出现乱码的原因是，网页服务端有bug，它硬性使用使用某种特定的编码方案，而并没有按照客户端的请求头的编码要求来发送编码。解决方案：使用chardet来猜测网页编码。1.去chardet官网下载chardet的py源码包。2.把...
python 爬虫运行错误 python
2022-07-15 13:05

回答 3 已采纳改正后代码： import urllib.request import urllib.parse url = 'https://fanyi.baidu.com/v2transapi?from=en
python模拟twitter登陆 python twitter
2015-03-17 07:32

回答 4 已采纳你可以试试 requests库。 http://www.python-requests.org/en/latest/user/advanced/#session-objects 做登录主要是状态同
关于#python#的问题，如何解决？ python 爬虫
2023-03-07 17:40

回答 3 已采纳 “Devil组”引证GPT后的撰写：这个错误是由于文件写入时使用的默认编码为 'gbk'，而 p.text 中含有无法被 'gbk' 编码的字符。可以将文件的编码格式改为 'utf-8'，这样就可以处
使用Python的urllib2模块处理url和图片的技巧两则
2020-12-25 02:33

对于中文的参数如果不进行编码的话，python的urllib2直接处理会报错，我们可以先将中文转换成utf- 8编码，然后使用urllib2.quote方法对参数进行url编码后传递。 content = u'你好 sharejs.com' content = content....
无法使用Github，网页可以正常打开，但CSV文件无法获取。 github python 有问必答
2021-06-28 22:07

回答 2 已采纳要在github上获取原始数据。但下载通道给堵死了，所以不能下载参考：实用小技巧-----解决从Github上获取.csv文件_Kiiato的博客-CSDN博客
python2 urllib模块_python urllib2模块
2021-01-14 11:32

阿航先生的博客与urllib的区别Python的urllib和urllib2模块都做与请求URL相关的操作；3.x的版本urllib与urllib2已经合并为一个urllib库；2.7的版本urllib与urllib2各有各的作用，urllib与urllib2并不是可以代替的，2是1的补充；...
python urllib2_python urllib2详解及实例
2020-11-30 12:21

weixin_39646405的博客 urllib2是Python的一个获取URLs(Uniform Resource Locators)的组件。他以urlopen函数的形式提供了一个非常简单的接口，这是具有利用不同协议获取URLs的能力，他同样提供了一个比较复杂的接口来处理一般情况，例如：...
没有解决我的问题, 去提问

悬赏问题

¥15 Python中的request，如何使用ssr节点，通过代理requests网页。本人在泰国，需要用大陆ip才能玩网页游戏，合法合规。
¥100 为什么这个恒流源电路不能恒流？
¥15 有偿求跨组件数据流路径图
¥15 写一个方法checkPerson，入参实体类Person，出参布尔值
¥15 我想咨询一下路面纹理三维点云数据处理的一些问题，上传的坐标文件里是怎么对无序点进行编号的，以及xy坐标在处理的时候是进行整体模型分片处理的吗
¥15 CSAPPattacklab
¥15 一直显示正在等待HID—ISP
¥15 Python turtle 画图
¥15 stm32开发clion时遇到的编译问题
¥15 lna设计源简并电感型共源放大器

urllib2获取网页信息时的中文编码

2条回答 默认 最新

悬赏问题

2条回答默认最新