GSE_ 2022-04-30 20:03 采纳率: 72.7%
浏览 15
已结题

python编码问题

问题遇到的现象和发生背景

编译器是pycharm,环境是anaconda3,解释器是python3.8
代码的作用是获取给某好友qq空间点赞的账户信息
在最后一行print报错

问题相关代码,请勿粘贴截图
#preparing
import requests as re
from lxml import etree
headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.41 Safari/537.36'}
url = "https://user.qzone.qq.com/"
#get the QQ number
fp = open("source/qqnumber.txt")
qn = fp.readline(11)
fp.close
#get the QQ cookie
fp = open("source/qqcookie.txt")
headers['cookie'] = fp.readline()
#update the string
url = url + qn
print(url)
#start
res = re.get(url='https://user.qzone.qq.com/proxy/domain/ic2.qzone.qq.com/cgi-bin/feeds/feeds_html_module?g_iframeUser=1&i_uin=2470851837&i_login_uin=1498164408&mode=4&previewV8=1&style=35&version=8&needDelOpr=true&transparence=true&hideExtend=false&showcount=5&MORE_FEEDS_CGI=http%3A%2F%2Fic2.s6.qzone.qq.com%2Fcgi-bin%2Ffeeds%2Ffeeds_html_act_all&refer=2&paramstring=os-win7|100',headers=headers)
result = res.text.encode('utf-8').decode('utf-8')
fp =open('lloutput/output.txt','w+',encoding='utf-8')
fp.write(result)
#print(res.text)
fp.close()
html = etree.HTML(result)
print(html.xpath('//*[@class="user-list"]/text()'))

运行结果及报错内容

问题出现在最后一行,错误是“UnicodeEncodeError: 'gbk' codec can't encode character '\xe3' in position 2: illegal multibyte sequence”

我的解答思路和尝试过的方法

后面在pycharm里把编码改成了utf-8,不报错了,但是打印出来的是乱码

我想要达到的结果

乱码变成正常的文字,以完成接下来的操作

  • 写回答

1条回答 默认 最新

  • 不会长胖的斜杠 后端领域新星创作者 2022-04-30 20:42
    关注
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 8月6日
  • 已采纳回答 7月29日
  • 创建了问题 4月30日

悬赏问题

  • ¥20 Linux上make出现错误不知道怎么解决
  • ¥15 prism提示我reinstall prism 如何解决
  • ¥15 asp.core 权限控制怎么做,需要控制到每个方法
  • ¥20 while循环中OLED显示中断中的数据不正确
  • ¥15 这个视频里的stm32f4代码是怎么写的
  • ¥15 JNA调用DLL报堆栈溢出错误(0xC00000FD)
  • ¥15 请教SGeMs软件的使用
  • ¥15 自己用vb.net编写了一个dll文件,如何只给授权的用户使用这个dll文件进行打包编译,未授权用户不能进行打包编译操作?
  • ¥50 深度学习运行代码直接中断
  • ¥20 需要完整的共散射点成像代码