cyj2020014009 2023-02-09 21:24 采纳率: 100%
浏览 21
已结题

关于requests.get获取网页信息的一个编码问题

import requsets
url = '......'
resp = requsets.get(url)
a = resp.text
print(a)
resp.close()

我的问题是,我从 a 中得到了这个网页所采用编码的字符集是 gb2312
我直接 a.encode('gb2312')
这样他会告诉我有一些字符是解码不了的 像这样:UnicodeEncodeError: 'gb2312' codec can't encode character '\xb5' in position 251: illegal multibyte sequence
但是我用 resp.encoding = 'gb2312' 再打印a 这样就能够得出解码的东西
在这两部分进行解码得到的结果不一样,我想问这是为什么? 感谢感谢

  • 写回答

2条回答 默认 最新

  • 一花一草皆风景 2023-02-09 21:31
    关注

    题主,编码是有区别的,参考:https://www.51cto.com/article/687483.html
    如有疑问,可以继续与我联系。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 2月18日
  • 已采纳回答 2月10日
  • 创建了问题 2月9日

悬赏问题

  • ¥15 如何在炒股软件中,爬到我想看的日k线
  • ¥15 51单片机中C语言怎么做到下面类似的功能的函数(相关搜索:c语言)
  • ¥15 seatunnel 怎么配置Elasticsearch
  • ¥15 PSCAD安装问题 ERROR: Visual Studio 2013, 2015, 2017 or 2019 is not found in the system.
  • ¥15 (标签-MATLAB|关键词-多址)
  • ¥15 关于#MATLAB#的问题,如何解决?(相关搜索:信噪比,系统容量)
  • ¥500 52810做蓝牙接受端
  • ¥15 基于PLC的三轴机械手程序
  • ¥15 多址通信方式的抗噪声性能和系统容量对比
  • ¥15 winform的chart曲线生成时有凸起