辛弃疾不急
2021-07-01 20:13
采纳率: 100%
浏览 29

为什么我用pythen爬取百度显示汉字乱码?

img

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 邀请回答

3条回答 默认 最新

  • 已采纳

    获取requests.get()请求数据之后要先用 res.encoding='utf-8' 设置内容的编码再取 res.text 内容

    res=requests.get(f'http://www.xxxxxxxx',headers=head)
    res.encoding='utf-8' 
    html = res.text
    
    点赞 打赏 评论
  • CSDN专家-HGJ 2021-07-01 21:06

    在requests.get()之后加上一行代码,即可解决汉字乱码问题:res.encoding=res.apparent_encoding

    点赞 打赏 评论
  • 辛弃疾不急 2021-07-01 21:09

    from urllib.request import urlopen

    url = "http://www.baidu.com" resp = urlopen(url) with open("mybaidu.html", mode="w") as f: f.write(resp.read().decode("utf-8")) print("over")

    点赞 打赏 评论

相关推荐 更多相似问题