weixin_44608359 2022-04-08 22:29 采纳率: 66.7%
浏览 47
已结题

python 爬取后一直有一小段是乱码,不知道这是怎么回事

请问这是怎么回事啊
这个我找了很多地方,可还是不知道怎么去修改,才开始学,难以下手

img

img

  • 写回答

2条回答 默认 最新

  • 关注

    你requests 读取页面文件的编码不对 ,用 res.encoding='utf-8'或res.encoding='gbk'设置下读取页面文件用的编码, 再获取res.text即可,比如

    res=requests.get('http://www.xxxx.com')
    res.encoding='utf-8'
    #或res.encoding='gbk'
    print(res.text)
    

    或者也可以设置 res.encoding=res.apparent_encoding 自动从网页的内容中分析网页编码

    如有帮助,请点击我的回答下方的【采纳该答案】按钮帮忙采纳下,谢谢!

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 4月16日
  • 已采纳回答 4月8日
  • 创建了问题 4月8日

悬赏问题

  • ¥100 支付宝网页转账系统不识别账号
  • ¥15 基于单片机的靶位控制系统
  • ¥15 AT89C51控制8位八段数码管显示时钟。
  • ¥15 真我手机蓝牙传输进度消息被关闭了,怎么打开?(关键词-消息通知)
  • ¥15 下图接收小电路,谁知道原理
  • ¥15 装 pytorch 的时候出了好多问题,遇到这种情况怎么处理?
  • ¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
  • ¥15 手机接入宽带网线,如何释放宽带全部速度
  • ¥30 关于#r语言#的问题:如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测
  • ¥15 ETLCloud 处理json多层级问题