为什么我这个代码爬出来的内容是乱的,哪里错了吗,求神指导一下。
4条回答 默认 最新
- 天际的海浪 2022-07-03 00:28关注
你requests 读取页面文件的编码不对 ,用 response.encoding='utf-8'或response.encoding='gbk'设置下读取页面文件用的编码, 再获取response.text即可
(response 是requests.get()返回的对象)
,比如response=requests.get('http://www.xxxx.com') response.encoding='utf-8' #或response.encoding='gbk' print(response.text)
或者也可以设置 response.encoding=response.apparent_encoding 自动从网页的内容中分析网页编码
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 求螺旋焊缝的图像处理
- ¥15 blast算法(相关搜索:数据库)
- ¥15 请问有人会紧聚焦相关的matlab知识嘛?
- ¥15 网络通信安全解决方案
- ¥50 yalmip+Gurobi
- ¥20 win10修改放大文本以及缩放与布局后蓝屏无法正常进入桌面
- ¥15 itunes恢复数据最后一步发生错误
- ¥15 关于#windows#的问题:2024年5月15日的win11更新后资源管理器没有地址栏了顶部的地址栏和文件搜索都消失了
- ¥100 H5网页如何调用微信扫一扫功能?
- ¥15 讲解电路图,付费求解