python，爬虫，为什么会出现乱码

跟着写的代码，但是运行出来是乱码，生成的html运行出来也是乱的
图：、

尝试了很多次都是错的

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
starlight_2007 2023-01-20 22:55
关注
如果要解决乱码问题，可以修改requests.get().text语句，如下所示：

import requests resp = requests.get("https://www.baidu.com").content

这会以字节的形式返回数据，不会在数据传递过程中因为模块的自动编译，产生编译错误。
最后，将resp按照字节的写入方式写入文档，创建html。
注意：这一系列方法生成的html文件无法获得百度网页的js图形渲染(尤其是动态)效果。

with open('test_html.html','ab+') as f: f.write(resp) f.close()

附图：

（图中的动态Baidu logo就没有获取到）
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

python，爬虫，为什么会出现乱码 python
2023-01-20 21:41

回答 2 已采纳如果要解决乱码问题，可以修改requests.get().text语句，如下所示： import requests resp = requests.get("https://www.baidu.com
Python爬虫配合VPN爬取出现报错 python 爬虫
2021-12-22 17:33

回答 1 已采纳你这个是VPN代理问题，你可以将VPN设置成部分代理，不要全部代理你的网络。
Python 爬虫乱码 python 开发语言
2023-01-25 13:07

回答 3 已采纳有点怪，源代码在我的环境里运行后，没有乱码。想了想，有可能是如下原因导致乱码：（1）在用户未知的情况下，环境自动按某种格式编译了内容，然后在反复、不对应的编译格式转换下出现乱码。（2）指定的编码格
盘点3种Python爬虫中文乱码的处理方法
2023-11-22 10:24

认真写程序的强哥的博客本文针对Python网络爬虫过程中的中文乱码问题，给出了3种乱码解决方法，顺利解决了问题。你还知道有哪些乱码的情况和处理方法，欢迎在评论区中留言。感兴趣的小伙伴，赠送全套Python学习资料，包含面试题、简历资料...
python爬虫中网页出现乱码如何解决？ python
2021-09-21 22:16

回答 1 已采纳 request.encoding = request.apparent_encoding
python爬虫爬取网页为什么获得的不是正常网页数据 python 爬虫
2022-05-12 14:48

回答 2 已采纳这代码里面好多错误，你是怎么运行成功的？
python爬虫乱码问题怎么解决 python
2022-04-20 16:13

回答 2 已采纳 with open ("mybaidu.html", mode = "w", encoding = "utf-8")这里面填一个encoding就好了
Python 爬虫中文乱码一文通
2022-07-27 01:14

H-大叔的博客还在找python中文乱码的解决方法？来跟我学习，一文直接PASS。
python爬虫xpath解析返回为空有什么解决方法吗 python 爬虫
2021-12-10 11:12

回答 1 已采纳为空的地方xpath主要是为了拿到什么数据，贴一下网页和要拿到的数据，帮你写一下xpath。上面图上的xpath那么长那么绝对路径，大概率拿不到数据的。
关于爬虫response出现乱码 python 开发语言有问必答爬虫
2022-11-12 10:11

回答 4 已采纳 session.post(hfUrl, headers=hfHeader, data=hfData, params=hfParam).content.decode('对方网站的编码，比如gbk或者ut
python爬虫request后返回值为空 chrome python 有问必答爬虫
2022-01-27 16:25

回答 2 已采纳接口需要post请求并发送数据，题主get请求没用改下面就可以了，注意不能采集太快，有防火墙会拦截。。-_-||。。。 import requests import time headers =
Python爬虫为何会乱码？
2020-10-26 14:30

万变ip的博客今天万变http代理跟大家分享常见的问题，就是爬虫为什么会发生乱码。网络爬虫总共有两种，一是选择nutch、hetriex，二是自写网络爬虫，二者在解决乱码时，基本原理是相同的，但前面解决乱码时，需要看懂源码后进行...
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
全网最全python爬虫精进
2021-04-25 17:33

yk 坤帝的博客 4.25(第一天) ** 第0关认识爬虫 ** 1、初始爬虫爬虫，从本质上来说，就是利用程序在网上拿到对我们有价值的数据。 2、明晰路径 2-1、浏览器工作原理（1）解析数据：当服务器把数据...（1）获取数据：爬虫程序会根据
Python爬虫中文乱码处理实例代码解析
2023-12-23 20:00

Sitin涛哥的博客在本文中，深入探讨了Python爬虫中处理中文乱码的各种方法，旨在帮助大家解决在网络数据抓取过程中常见的编码问题。这些问题可能导致数据解析不正确，影响到数据质量和可靠性。从明确指定编码、使用第三方库（如...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月20日

悬赏问题

¥100 set_link_state
¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度

python，爬虫，为什么会出现乱码

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新