皮在养 2023-01-19 16:14 采纳率: 100%
浏览 57
已结题

爬虫爬网站遇到编码器问题

学习爬虫遇到解析问题,爬取一个网站出现gbk问题,求指点。才学习爬虫不知道怎么处理这个问题。

代码:import requests

url = "https://www.xxxxx.html"

headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36"
}

resp = requests.post(url, headers=headers)

print(resp.text)

报错:Traceback (most recent call last):
File "D:\pythonProject\jjj.py", line 12, in
print(resp.text)
UnicodeEncodeError: 'gbk' codec can't encode character '\xa9' in position 26428: illegal multibyte sequence

  • 写回答

4条回答 默认 最新

  • 皮在养 2023-01-20 09:35
    关注

    成功了,加这一句

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 1月28日
  • 已采纳回答 1月20日
  • 修改了问题 1月19日
  • 创建了问题 1月19日

悬赏问题

  • ¥100 求购一套带接口实现实习自动签到打卡
  • ¥50 MacOS 使用虚拟机安装k8s
  • ¥500 亚马逊 COOKIE我如何才能实现 登录一个亚马逊账户 下发新 COOKIE ..我使用下发新COOKIE 导入ADS 指纹浏览器登录,我把账户密码 修改过后,原来下发新COOKIE 不会失效的方式
  • ¥20 玩游戏gpu和cpu利用率特别低,玩游戏卡顿
  • ¥25 oracle中的正则匹配
  • ¥15 关于#vscode#的问题:把软件卸载不会再出现蓝屏
  • ¥15 vimplus出现的错误
  • ¥15 usb无线网卡转typec口
  • ¥30 怎么使用AVL fire ESE软件自带的优化模式来优化设计Soot和NOx?
  • ¥15 Ubuntu20.04.4.LTS系统如何下载安装VirtualBox虚拟机?