requests库返回的html文档和response.text不一致

我使用requests库请求返回的response.text保存为html文档后，可以搜到我想要的元素，但是我打断点，将response.text手工复制到html后，格式化文档后，却搜不到该元素及其它一些元素，就是说保存后的response.text和保存前的response.text不一致，请问是什么原因？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-04-27 04:05
关注
你看下这篇博客吧, 应该有用👉 ：通过requests包爬虫response.text中文乱码
除此之外, 这篇博客: 爬虫(7)一文搞懂爬虫的网络请求,requests库的使用中的 response.text和response.content的区别: 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
1.response.content:这个是直接从网络上抓取的数据,没有经过任何的编码.所以是一个bytes类型的,其实在硬盘上和在网络上传输的字符串都是bytes类型.
2.response.text:这个数str的数据类型,是requests库将response.content进行编码的字符串,解码需要指定一个编码方式,requests会根据自己的猜测来判断解码的方式,所以有的时候会猜测错误,从而造成乱码,这时候应该用response.content.encode('utf-8').decode('utf-8')

有的客官会讲:你这人怎么回事,讲了get请求不讲post请求,搞哪样
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

从url获取到了response却无法获取到response中的具体内容，response.text显示{code:0,msg:'limited'} python webview
2022-01-10 16:51

回答 1 已采纳加个请求头 import requests url = 'https://item-soa.jd.com/getWareBusiness?skuId=100012809042&cat=737,794
requests.text爬出来的网页不全 python 有问必答
2022-10-07 17:44

回答 3 已采纳这个网址搜索结果是ajax动态加载，用request获取不到结果，除非用selenium来爬。直接请求接口获取数据就行 import requests import re from urllib im
pytho3开启fiddler，requests.post(xxx).text访问报错 python
2021-03-22 15:10

回答 3 已采纳 page= requests.post(url,headers=headers,json=json,verify=False).text 开启fiddler的时候在请求里面加上verify=F
lxml，一个超牛的Python库
2024-08-30 20:41

黑马非马.的博客 lxml是一个基于 Python 的库，用于处理 XML 和 HTML。它提供了简洁而高效的接口，以及快速的解析和搜索功能，常用于网络爬虫、数据解析等领域。
python中requests库中文乱码问题 html python 爬虫
2022-08-22 09:50

回答 5 已采纳设置一下编码集就行了： import requests url = 'https://www.baidu.com/s?%27' headers = { 'User-Agent': 'Mozilla
写爬虫时，需要的html和用requests.get返回的html不一样导致无法进行下一步，请问怎么解决？？ python
2020-01-03 13:50

回答 3 已采纳用request的get方法得到的是服务器返回给你的源码，而你用f12调试看到的是浏览器解释过后的代码，不一样是正常的，要获取f12看到的可以用selenium模拟访问
Python的requests.get()获取不到正确的网页源码 python 有问必答
2021-06-21 14:46

回答 2 已采纳需要添加headers。 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36
espeak 中文语音包_从零开始搭建一个语音对话机器人
2020-11-02 08:25

weixin_39825872的博客 requests.request("post", api_url, json=req, headers=headers) response_dict = json.loads(response.text) result = response_dict["results"][0]["values"]["text"] print("AI Robot said: " + result) return ...
requests.get得到的不是中文也不是unicode怎么解决呢？ python 有问必答
2021-05-18 13:36

回答 2 已采纳推荐这篇文章请参阅https://ask.csdn.net/questions/748663
python 爬虫 requests.get() 所有网页都打不开 python 爬虫
2022-09-24 23:49

回答 1 已采纳 http协议都没加
Requests 返回结果的目标内容是js html5 python 有问必答
2021-04-17 23:05

回答 6 已采纳你的截图的结果是JS代码执行之后的结果，那个只做参考不能作为爬虫的结果爬虫requests获取的结果是你右键-查看网页源代码里面看到的内容也是没有执行JS的结果如果你想获取那个数据，2
Python3从零开始搭建一个语音对话机器人
2019-07-19 17:00

夜空骑士的博客 requests.request("post", api_url, json=req, headers=headers) response_dict = json.loads(response.text) result = response_dict["results"][0]["values"]["text"] print("AI Robot said: " + result) return ...
requests.exceptions.InvalidURL: Failed to parse: <Response [200]> python 有问必答爬虫
2021-08-26 09:47

回答 2 已采纳 url_get = requests.get(" http://music.163.com/song/media/outer/url?id%22
有没有python与机械结合的工作-Python3从零开始搭建一个语音对话机器人的实现...
2020-11-01 18:34

weixin_37988176的博客（2）准备百度API 点击技术文档：阅读语音识别的技术文档，重点查看API文档和Python SDK，了解如何在python中调用API接口。点击立即使用：进入到服务界面，创建应用。记住最重要的App ID、API Key、Secret Key，...
Robyn与FastAPI全面对比：选择最适合你的Python Web框架
2024-08-14 13:44

我就是全世界的博客 Python作为一种广泛使用的编程语言，其生态系统中涌现出了众多优秀的Web框架，如FastAPI和Robyn。FastAPI自发布以来，因其高性能、易用性和自动生成API文档的特性，迅速成为开发者的首选。而Robyn，作为一个结合了...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月27日

悬赏问题

¥200 csgo2的viewmatrix值是否还有别的获取方式
¥15 Stable Diffusion，用Ebsynth utility在视频选帧图重绘，第一步报错，蒙版和帧图没法生成，怎么处理啊
¥15 请把下列每一行代码完整地读懂并注释出来
¥15 pycharm运行main文件，显示没有conda环境
¥15 寻找公式识别开发，自动识别整页文档、图像公式的软件
¥15 为什么eclipse不能再下载了？
¥15 编辑cmake lists 明明写了project项目名，但是还是报错怎么回事
¥15 关于#计算机视觉#的问题：求一份高质量桥梁多病害数据集
¥15 特定网页无法访问，已排除网页问题
¥50 如何将脑的图像投影到颅骨上

requests库返回的html文档和response.text不一致

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新