Python编码问题，cgi脚本输出BeautifulSoup处理的中文内容（decode处理）出错

 最近写一个程序，想要先用BeautifulSoup处理一个html页面，然后再输出一下到我的一个python写的cgi页面上，因为一些中文字符都是\X**的格式，网上查了说BeautifulSoup输出的是unicode字符。然后需要把字节类型的转为字符输出。在ide中是可以正常转换的。
 但是使用cgi脚本在浏览器中浏览时就会出错，报一个UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 89: illegal multibyte sequence 错误，不清楚是为什么。网上有人说输出的文件是gbk编码导致的，但是我的是html页面，所以不知道如何处理，希望大牛帮忙解答。或者推荐我有关python编码的书也可以，很想弄明白这是为什么。

我使用的版本是python3.3

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Marst Code 2023-06-28 10:44
关注
问题点: 中文编码问题
解决方案:

脚本里带上 # -- coding: UTF-8 -- ;
处理字符串时,进行编码 value.encode('utf-8') .
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫 BeautifulSoup解析网页爬取内容为None python 有问必答
2021-08-31 14:07

回答 2 已采纳你抓的频率太快，IP被墙了
python—用PIP安装了beautifulsoup库，使用的时候老是报错 python
2021-08-10 16:18

回答 2 已采纳不能带有空格
python 使用BeautifulSoup 出错 python
2017-08-16 08:57

回答 3 已采纳 nostarchsoup=bs4.BeautifulSoup(res.text，'html.parser')这样写
六万字带你一次性速通python爬虫基础
2022-03-04 21:56

跳探戈的小龙虾的博客网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。...
python3大学排名，输出问题！ python
2022-04-29 12:48

回答 2 已采纳 def printUnivList(num): print("{:^4}{:^10}{:^5}{:^8}{:^10}".format ("排名","学校名称","省
python爬虫问题，BeautifulSoup提问，真心求教，急 python
2021-04-26 13:53

回答 1 已采纳首先在使用爬虫前您需要确保爬取的页面数据是全部的即不存在动态加载的情况若有的数据是动态加载的您还需要爬取网页所携带的的json文件
beautifulSoup4爬虫问题，python简单代码请教一下 python 有问必答爬虫
2022-01-15 17:29

回答 1 已采纳就是获取 soup.find_all("script", type="text/javascript") 返回的结果，取第3个元素的文本。
“人生苦短，我用Python“——Web测试
2022-11-07 22:31

小不为霸的博客网页的其他页面则提供了其他的功能，例如，用来展示内容的页面，用来进行登录的页面等。不过有些页面并不应该展示给用户，这些页面可能包含网站的敏感信息，但是很多程序员往往会没有隐藏这个页面，在大多数时候，这...
Python用beautifulsoup爬取网页数据 python
2022-04-29 00:54

回答 1 已采纳是不是最后一页的数据？导出覆盖了吧
关于#BeautifulSoup#的问题，如何解决？(语言-python) python
2022-11-27 09:23

回答 1 已采纳帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/7538372你也可以参考下这篇文章：python使用beautifulsoup 获取标签,经典笔记
关于python爬虫中beautifulsoup4与正则表达式的运用问题！ python
2020-06-21 21:50

回答 1 已采纳 soup.find_all(href=re.compile("view")) soup.查找所有（href属性里面含有view关键字）的结果有时间看看RE模块的用法
Python 三国人物数据快速采集极简方法汇总
2021-05-29 20:24

Mr数据杨的博客想象一下，如果三国时代的智囊们掌握了Python爬虫技术，那将会是怎样的情况呢？让我带你们一起走进这个历史和现代技术交融的奇幻世界。首先有一个数据目标，就像当年郭嘉把目标锁定在襄阳，帮助曹操实现天下霸业。...
python beautifulsoup 解析html无法获得全部html代码 python
2021-01-04 15:04

回答 3 已采纳因为这个div里面的内容是用ajax动态加载的，而用request获取的是网页的源代码（就是“右键菜单->查看网页源代码”的内容），不包含ajax动态加载的内容。所以要找到ajax加载数据的
python数据获取与数据清洗_python数据采集7-数据清洗
2020-12-29 05:52

weixin_39574708的博客 python数据采集7-数据清洗数据清洗到目前为止，我们还没有处理过那些样式不规范的数据，要么是使用样式规范的数据源，要么就是彻底放弃样式不符合我们预期的数据。但是在网络数据采集中，你通常无法对采集的数据样式...
Python之微信公众号自动化运营实践
2024-01-07 23:24

Zaralike的博客利用重写去重，得到优化后的文章内容3.通过推送至公众号后台4.审核修改后发送重点在前3步，希望通过前3步减少前期内容准备工作，最后仅需确认即可发布。当然上面的方法仅适用于公众号，其他类型比如内容为王的公众号...
没有解决我的问题, 去提问

悬赏问题

¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！

Python编码问题，cgi脚本输出BeautifulSoup处理的中文内容（decode处理）出错

1条回答 默认 最新

悬赏问题

1条回答默认最新