m0_64963817 2022-07-02 23:21 采纳率: 100%
浏览 41
已结题

不懂就问,为什么我爬出来的是个乱码

为什么我这个代码爬出来的内容是乱的,哪里错了吗,求神指导一下。

img

  • 写回答

4条回答 默认 最新

  • 天际的海浪 2022-07-03 00:28
    关注

    你requests 读取页面文件的编码不对 ,用 response.encoding='utf-8'或response.encoding='gbk'设置下读取页面文件用的编码, 再获取response.text即可
    (response 是requests.get()返回的对象)
    ,比如

    response=requests.get('http://www.xxxx.com')
    response.encoding='utf-8'
    #或response.encoding='gbk'
    print(response.text)
    

    或者也可以设置 response.encoding=response.apparent_encoding 自动从网页的内容中分析网页编码

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 7月12日
  • 已采纳回答 7月4日
  • 创建了问题 7月2日

悬赏问题

  • ¥15 求螺旋焊缝的图像处理
  • ¥15 blast算法(相关搜索:数据库)
  • ¥15 请问有人会紧聚焦相关的matlab知识嘛?
  • ¥15 网络通信安全解决方案
  • ¥50 yalmip+Gurobi
  • ¥20 win10修改放大文本以及缩放与布局后蓝屏无法正常进入桌面
  • ¥15 itunes恢复数据最后一步发生错误
  • ¥15 关于#windows#的问题:2024年5月15日的win11更新后资源管理器没有地址栏了顶部的地址栏和文件搜索都消失了
  • ¥100 H5网页如何调用微信扫一扫功能?
  • ¥15 讲解电路图,付费求解