为什么爬虫没法获得网页的码？

问题遇到的现象和发生背景

为什么爬虫没法获得网页源代码？

用代码块功能插入代码，请勿粘贴截图

import requests
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36 SE 2.X MetaSr 1.0'}
url = 'https://www.baidu.com/s?rtt=1&bsst=1&cl=2&tn=news&ie=utf-8&word=阿里巴巴'
res = requests.get(url, headers=headers)
res.encoding = 'utf-8'

print(res.text)

运行结果及报错内容

我想要达到的结果

想知道为什么不对，该怎么改

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

Ko-walski 2022-10-14 19:33

关注

不去控制台看真实请求接口这能行吗
cookie换成你的

import requests

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36 SE 2.X MetaSr 1.0',
    'Cookie': 'BIDUPSID=A87FDC113E9F5C879F4BEA4D7D6F5A72; PSTM=1662346944; BD_UPN=12314753; newlogin=1; BDUSS=40SGNtOGUzSFh2NHFTSi0zZW9Pa0pIeE5NUnB6Ymt0RDdIUGdqVTVDaUpWMTlqRVFBQUFBJCQAAAAAAAAAAAEAAACJedgyQUHHo8POAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAInKN2OJyjdjSU; BDUSS_BFESS=40SGNtOGUzSFh2NHFTSi0zZW9Pa0pIeE5NUnB6Ymt0RDdIUGdqVTVDaUpWMTlqRVFBQUFBJCQAAAAAAAAAAAEAAACJedgyQUHHo8POAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAInKN2OJyjdjSU; BAIDUID=A87FDC113E9F5C878BD59310E3A6E04A:SL=0:NR=10:FG=1; ispeed_lsm=2; BDORZ=FFFB88E999055A3F8A630C64834BD6D0; sug=3; sugstore=1; ORIGIN=0; bdime=0; BAIDUID_BFESS=A87FDC113E9F5C878BD59310E3A6E04A:SL=0:NR=10:FG=1; Hm_lvt_aec699bb6442ba076c8981c6dc490771=1665671890,1665745286; Hm_lpvt_aec699bb6442ba076c8981c6dc490771=1665745286; delPer=0; BD_CK_SAM=1; PSINO=5; BA_HECTOR=212024a12ha5a0010h84886k1hkigg61a; ZFY=:BKhQhsIdmwipwi9PbQ4h5ytjGOPXDsCSQfVRTuUcXVE:C; baikeVisitId=af3dc6a3-770a-4941-ad83-ab9dd0ce59ae; COOKIE_SESSION=129_0_1_0_8_1_1_0_1_1_0_0_129_0_1_0_1665745416_0_1665745415%7C5%230_0_1665745415%7C1; H_PS_645EC=9813r29D6TCK%2BXRVz5TlZby%2BLvNs6AnvuSOkr76NyC4OTdjCvtetKIWOu%2FPQSLqexz77iV8tlV4L; BDRCVFR[C0p6oIjvx-c]=mk3SLVN4HKm; H_PS_PSSID=37568_36551_37551_37358_37396_36807_37405_36789_37538_37497_37508_22159_37570; BDSVRTM=955'
}
url = 'https://www.baidu.com/s?rtt=1&bsst=1&cl=2&tn=news&ie=utf-8&word=%E9%98%BF%E9%87%8C%E5%B7%B4%E5%B7%B4'
res = requests.get(url, headers=headers)
res.encoding = 'utf-8'

print(res.text)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

Python爬虫:从后端分析为什么你爬虫爬取不到数据
2023-06-08 21:44

坚持不懈的大白的博客总结下述为AI对于为什么爬虫爬取不到数据的分析：有很多原因可能导致你的爬虫爬取不到数据，以下是一些常见的原因：网站防爬虫机制：有些网站会设置反爬虫机制，如验证码、IP限制等。如果你的爬虫被识别为恶意...
python后端和爬虫_【后端开发】python的爬虫是什么意思
2021-02-10 03:20

瑞士鲁迅的博客 Python爬虫即使用Python程序开发的网络爬虫(网页蜘蛛，网络机器人)，是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。其实通俗的讲就是...
什么是爬虫？
2024-10-16 06:06

Github项目推荐的博客爬虫（Web Crawler）是自动化程序，用于自动访问网页并抓取网页数据。爬虫可以系统性地从一个或多个网站收集数据，并将其用于多种目的，例如搜索引擎索引、数据分析、市场研究等。常见的爬虫工具如Googlebot会抓取...
为什么PHP爬虫抓取失败？解析cURL常见错误原因
2024-11-26 13:48

亿牛云爬虫专家的博客利用爬虫技术，我们能够迅速收集海量的电影评分、评论内容及趋势信息，为电影市场推广提供详实的量化依据。豆瓣电影评分作为中国电影市场的重要参考指标，凭借其广泛覆盖的观众反馈和真实评分，成为电影市场推广和...
一个管理磁力和漫画爬虫的springboot项目（kb磁力后端）.zip
2024-03-08 12:17

如果您下载了本程序，但是该程序存在问题无法运行，那么您可以选择退款或者寻求我们的帮助（如果找我们帮助的话，是需要追加额外费用的）。另外，您不会使用资源的话（这种情况不支持退款），也可以找我们帮助（需要...
【Go语言爬虫】为什么要用Go语言写爬虫？
2025-11-05 19:32

数据知道的博客 Go爬虫的核心优势，总结概述如下：极致并发：Goroutines和Channels提供了无与伦比的并发性能和编程模型。高性能：编译型语言，运行速度快，内存占用低。部署简单：编译成无依赖的二进制文件，跨平台部署极其方便...
爬虫:细谈为什么你爬取不到数据
2025-04-15 16:01

坚持不懈的大白的博客细谈为什么你的爬虫程序爬取不到数据，理论上网页上看到，听到的，都应该能通过爬虫获取得到。
2024 python 求职常见面试题（北京爬虫/后端）
2021-11-15 19:14

JHC0000abc的博客负载均衡，修复脚本错误 503：常见场景为服务器无法使用，一般为服务器超载或者是停机维护，解决思路为查看服务器系统资源或者确定服务器开启状态 502,504：常见场景为web服务器故障，程序进程不够，一般解决思路为...
LobeChat能否解析网页内容？结合爬虫的高级用法
2025-12-16 13:14

无形小手的博客 LobeChat本身不直接解析网页，但通过插件机制调用外部爬虫服务，可实现网页内容抓取与智能理解。结合Trafilatura等工具提取正文，再由大模型生成摘要，构建‘输入链接→内容提炼→AI解读’的自动化流程，解决知识...
分级反爬虫是什么？JAVA实现反爬虫策略
2025-03-25 09:08

空说的博客因为你无法限制真实的用户，攻击者完全可以模拟真实用户的访问方式来获取你的网站数据，比如找 10 个用户，每人获取几百题。爬虫是有一定风险的，自己学习倒没问题，但是千万别给人家的网站造成压力了，搞不好就有...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月14日

为什么爬虫没法获得网页的码？

问题遇到的现象和发生背景

用代码块功能插入代码，请勿粘贴截图

运行结果及报错内容

我想要达到的结果

1条回答 默认 最新

问题事件

1条回答默认最新