使用python的requests库爬取百度中的数据显示乱码

使用python的requests库爬取百度中的数据

使用response.encoding = 'utf8'转换后

response.text仍然乱码

结果：

代码如下：


```python

import urllib.request
import urllib.parse
import requests
from bs4 import BeautifulSoup

# 模拟百度搜索
def baiduAPI(params):
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36",
        "Cookie": "HMACCOUNT_BFESS=BD73DB1D35AF871A; BDUSS_BFESS=VJJdkswYnVrT0JHUmFGTFRpTWhUUn5wLVlLbkJvTzA1WTBDcnZwQTU2UU9pYlZqRVFBQUFBJCQAAAAAAAAAAAEAAABcJyX5wO7KzcH6NwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA78jWMO~I1jc; BAIDUID_BFESS=2B61874755F437B5EC6BEF21B3134DF7:FG=1; ZFY=K9QfSyPCgzUKQk2s8CZ4eAp9owXYz:BJRF7ftEin2pJ8:C; H_PS_PSSID=36543_37552_38092_38052_37990_37796_36803_37930_38088_38041_26350_38009_37881; ab_sr=1.0.1_NzYyZWM1ZDU3OGQ2NGM2ODMxYmQ3MTZmNjE4YWI0OGY2NzIzYWY2YzQ3MjI3YTg5M2U2ODljYWFjZWY2NTg0ODE5NWY2YjhiZDk2YTQ2ZjU0NzZhM2MyZmY2YzFlOGM0YWRmZGU3ZDNkN2VjZjY4MjYwYzQ5MzNhYWQzOTdkYTExOWZkMDhhZTRlMzI0MWZkZGJkNDU3ZTk5YjY2N2ZhZDM3NjAwNDZhMGMxNjg4N2U4N2UwMzU4MTg3ZTFhNTY3",
        "Accept": "image/avif,image/webp,image/apng,image/svg+xml,image/*,*/*;q=0.8",
        "Accept-Encoding": "gzip, deflate, br",
        'Accept-Language': 'zh-CN,zh;q=0.9'
    }

    url = "https://www.baidu.com/s?" + params
    response = requests.get(url, headers=headers)
    response.encoding = 'utf8'

    print(response.text)

    #with open("zhongguo.html",'wb') as f:
    #    f.write(response.text)
    return response


if __name__ == "__main__":
    wd = {"wd": "中国"}
    params = urllib.parse.urlencode(wd)
    print(params)  # 'wd=aa'
    response = baiduAPI(params)
    # print(response.content)

```

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Halifax ‎ 2023-01-29 23:11
关注
望采纳！！！

设置一下编码集即可。

response = requests.get(url=url,headers=headers) content = response.content.decode('utf8') print(content)
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用python requests爬取百度图片的时候报错，不知道是哪里的问题 python 有问必答
2021-09-14 08:08

回答 2 已采纳主要是因为tn参数（你的代码写成n了，少了t）没传，接口返回404的html了，而不是返回查询结果内容。更正参数名称为tn就可以了。做采集的时候参数名一定不能写错，还有一些请求头也需要加上，如user
python使用xpath爬取网络数据报表结果为空 python 开发语言有问必答
2021-10-23 17:12

回答 3 已采纳该页面数据在XHR中找，构建一下headers和params，使用如下方式获json数据，然后从中解析即可： response = requests.get('https://fr.oppein.co
如何使用python爬取canvas中的内容呢？ css javascript python
2022-04-29 10:30

回答 1 已采纳需要在浏览器上临时显示后端实时处理的图像，需要将图像数据转成json字符串传输给js绘图。后端python处理： import cv2 as cvfrom encodings import base
Python使用requests库爬取中国新闻网新闻实例
2020-07-22 15:48

资深吹牛专家的博客 Python引入requests库这里以Pycharm为开发工具（用VSCode开发也没有什么区别，主要注意引入requests库和lxml解析库），点击左上角File，选择New Project新建项目如上图选择项目路径和Python解释器，点击Create...
python中requests库中文乱码问题 html python 爬虫
2022-08-22 09:50

回答 5 已采纳设置一下编码集就行了： import requests url = 'https://www.baidu.com/s?%27' headers = { 'User-Agent': 'Mozilla
Python requests.post方法爬取携程酒店获取不到数据 python
2021-07-28 11:42

回答 3 已采纳我猜请求头里面一定有数据是动态变化的，并且要做验证，你得知道它是如何加密的那些数据~
python爬虫爬取百度文库 python 有问必答
2021-05-09 14:36

回答 4 已采纳 Network中找不到试试在doc里面能不能找到
使用Python的requests库，轻松实现网络爬虫和数据抓取
2023-10-14 10:06

认真写程序的强哥的博客 requests库是一个用于发送HTTP请求的Python库。...使用requests库，你可以轻松地与Web服务器进行交互，获取响应内容、处理响应头部信息、处理...requests库的安装requests 的使用使用方法其它请求类型GET 请求传递参数。
python爬虫翻页爬取的数据是第一页的重复数据 python 爬虫问答团队
2021-12-18 19:23

回答 1 已采纳爬下一页就好了
如何用Python3爬取百度百科(最好lxml+requests，当然别的也行）？ python
2021-04-28 20:55

回答 1 已采纳基本问题，爬数的时候，模拟一下头文件浏览器打开 headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWe
python使用requests get爬取网页失败 python 有问必答
2021-04-17 17:26

回答 4 已采纳 https://www.baidu.com/s 改成 http://www.baidu.com/s
利用python requests库爬取淘宝商品评论_python
2020-04-22 16:06

waterme7on的博客利用Python requests库高效爬取淘宝商品评论
请问Python爬虫如何把爬取数据存入csv文件中 python 开发语言有问必答爬虫
2021-11-21 21:19

回答 1 已采纳你用open打开csv文件，然后以字符串格式写入就行了，每个数据之间用英文逗号隔开即可
盘点3种Python爬虫中文乱码的处理方法
2023-11-22 10:24

认真写程序的强哥的博客本文针对Python网络爬虫过程中的中文乱码问题，给出了3种乱码解决方法，顺利解决了问题。你还知道有哪些乱码的情况和处理方法，欢迎在评论区中留言。感兴趣的小伙伴，赠送全套Python学习资料，包含面试题、简历资料...
全网最全！Python爬虫requests库教程(附案例)
2023-07-08 14:15

程序员小麦的博客 requests 库是一个原生的 HTTP 库，比 urllib3 库更为容易使用。requests 库发送原生的 HTTP 1.1 请求，无需手动为 URL 添加查询串，也不需要对 POST 数据进行表单编码。相对于 urllib3 库， requests 库拥有完全...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月29日

悬赏问题

¥15 ue5 .3之前好好的现在只要是激活关卡就会崩溃
¥50 MATLAB实现圆柱体容器内球形颗粒堆积
¥15 python如何将动态的多个子列表，拼接后进行集合的交集
¥20 vitis-ai量化基于pytorch框架下的yolov5模型
¥15 如何实现H5在QQ平台上的二次分享卡片效果？
¥15 python爬取bilibili校园招聘网站
¥30 求解达问题（有红包）
¥15 请解包一个pak文件
¥15 不同系统编译兼容问题
¥100 三相直流充电模块对数字电源芯片在物理上它必须具备哪些功能和性能？

使用python的requests库爬取百度中的数据显示乱码

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新