Python爬虫利用requests库获得text乱码解决方法中的疑惑

学习Python爬虫中对解决方法的疑惑,请了解的朋友帮忙解解惑(本文第三点中的疑惑).谢谢.

一,乱码问题

import requests

response=requests.request('get','https://www.baidu.com')
print(response.text)

结果显示的文本中含有如下红框中的乱码:

二,解决办法
解决方法是:先取得响应response的content,再对content进行decode()解码,就可以正常显示中文.

三,针对本解决方法中的疑惑
使用"print(help(response))"查看响应对象所属类的帮助信息,其中关于"text"的描述如下:
表示response.text是unicode编码

使用"print(help(response.content))"查看帮助信息,其中有关信息如下:
表示response.content是一个bytes类型.

同时response.content具有decode()方法,该方法默认使用utf-8解码.

那么现在的疑问来了,python内部本来就是使用的unicode编码,response.text()不正好也是unicode编码吗?怎么会有乱码呢?
而对其字节流解码成unicode却就没有乱码了.

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Pliosauroidea 2021-09-07 15:41
关注
因为百度似乎用了一个神奇的编码方式

.text估计就是使用了这个编码方式导致无法读取

而context.decode使用的是默认的utf-8所以能正确读出来
以上都是我猜的()
有帮助望采纳

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python中——requests爬虫【中文乱码】的3种解决方法
2024-01-25 11:56

程序员老冉的博客 Python学习路线汇总Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。（学习教程文末领取哈）Python必备开发工具。
python系列：requests爬虫【中文乱码】的3种解决方法
2024-05-06 13:42

坦笑&&life的博客 requests爬虫【中文乱码】的3种解决方法
python中requests爬去网页内容出现乱码问题解决方法介绍
2020-12-25 08:45

最近在学习python爬虫，使用requests的时候遇到了不少的问题，比如说在requests中如何使用cookies进行登录验证，这可以查看这篇文章。这篇博客要解决的问题是如何避免在使用requests的时候出现乱码。 import ...
全网最全！Python爬虫requests库教程(附案例)
2023-07-08 14:15

程序员小麦的博客 Requests 是一个为人类设计的简单而优雅的 HTTP 库。requests 库是一个原生的 HTTP 库，比 urllib3 库更为容易使用。requests 库发送原生的 HTTP 1.1 请求，无需手动为 URL 添加查询串，...requests 库包含的特性如下。
解决python3中的requests解析中文页面出现乱码问题
2020-09-19 11:13

总的来说，解决requests在Python 3中解析中文页面出现乱码问题的关键在于正确设置`response.encoding`属性。在实际开发中，应对不同编码的网页有充分的认识，合理处理编码问题，确保数据的正确解析。在编写爬虫或...
盘点3种Python爬虫中文乱码的处理方法
2023-11-22 10:24

认真写程序的强哥的博客本文针对Python网络爬虫过程中的中文乱码问题，给出了3种乱码解决方法，顺利解决了问题。你还知道有哪些乱码的情况和处理方法，欢迎在评论区中留言。感兴趣的小伙伴，赠送全套Python学习资料，包含面试题、简历资料...
Python爬虫基于lxml解决数据编码乱码问题
2020-09-16 11:06

在Python爬虫开发中，经常会遇到数据编码导致的乱码问题。当爬取网页内容时，如果不正确地处理字符编码，输出的结果可能会显示为奇怪的符号，如"å·²éªè¯ å®å¨ ç¾ç"。这通常是因为网页的...
两万字博文教你python爬虫requests库【详解篇】
2021-07-12 13:00

孤寒者的博客两万字博文教你python爬虫requests库【详解篇】
Python爬虫 requests库详解
2024-02-04 10:17

可口可乐没有乐的博客此外，requests 还提供了证书验证的功能。但是一旦开始大规模爬取，对于大规模且频繁的请求，网站可能会弹出验证码，或者跳转到登录认证页面，更甚者可能会直接封禁客户端的 IP，导致一定时间段内无法访问。当然，...
解决Python网页爬虫之中文乱码问题
2020-09-20 11:57

总结来说，解决Python网页爬虫中的中文乱码问题，核心在于正确处理Unicode和UTF-8之间的编码转换。无论是手动设置系统默认编码，还是使用第三方库，都需要保证编码转换的正确性，以此来确保中文字符能够在爬虫中得到...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 9月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月7日

Python爬虫利用requests库获得text乱码解决方法中的疑惑

1条回答 默认 最新

问题事件

1条回答默认最新