weixin_45590534 2020-05-01 00:16 采纳率: 0%
浏览 3463

小白python爬网页错误:'gbk' codec can't decode byte 0x91 in position 1298: illegal multibyte sequence

跟着视频学爬了一下网页。网页编码是gb2312,代码如下:

import requests
base_url = "https://search.sina.com.cn/?"
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36',
}
params = {
    'q': '新型冠状病毒',
    'c': 'news',
    'from': 'channel',
    'ie': 'utf-8'
}
response = requests.get(base_url, headers=headers, params=params)
response_str = response.content.decode('gbk')

print(response.text)

with open('sina_news.html', 'w', encoding='gbk') as fp:
     fp.write(response_str)

然后就出现了这个错误:line 20, in
response_str = response.content.decode('gbk')
UnicodeDecodeError: 'gbk' codec can't decode byte 0x91 in position 1298: illegal multibyte sequence
查了很多方法都不太明白,用utf-8会乱码,用tryexcept和error ignore也是乱码。求助大佬们QAQ

  • 写回答

3条回答 默认 最新

  • 关注
    评论

报告相同问题?

悬赏问题

  • ¥500 把面具戴到人脸上,请大家贡献智慧
  • ¥15 任意一个散点图自己下载其js脚本文件并做成独立的案例页面,不要作在线的,要离线状态。
  • ¥15 各位 帮我看看如何写代码,打出来的图形要和如下图呈现的一样,急
  • ¥30 c#打开word开启修订并实时显示批注
  • ¥15 如何解决ldsc的这条报错/index error
  • ¥15 VS2022+WDK驱动开发环境
  • ¥30 关于#java#的问题,请各位专家解答!
  • ¥30 vue+element根据数据循环生成多个table,如何实现最后一列 平均分合并
  • ¥20 pcf8563时钟芯片不启振
  • ¥20 pip2.40更新pip2.43时报错