2 mailfor115 mailfor115 于 2013.11.08 21:27 提问

Python编码问题,cgi脚本输出BeautifulSoup处理的中文内容(decode处理)出错
 最近写一个程序,想要先用BeautifulSoup处理一个html页面,然后再输出一下到我的一个python写的cgi页面上,因为一些中文字符都是\X**的格式,网上查了说BeautifulSoup输出的是unicode字符。然后需要把字节类型的转为字符输出。在ide中是可以正常转换的。
 但是使用cgi脚本在浏览器中浏览时就会出错,报一个UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 89: illegal multibyte sequence 错误,不清楚是为什么。网上有人说输出的文件是gbk编码导致的,但是我的是html页面,所以不知道如何处理,希望大牛帮忙解答。或者推荐我有关python编码的书也可以,很想弄明白这是为什么。

我使用的版本是python3.3

Csdn user default icon
上传中...
上传图片
插入图片