爬虫获取豆瓣代码状态码418

获取豆瓣网络源码，为什么

# 准备请求数据
url = 'https://movie.douban.com/top250'
headers = {
    'User-Agents': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Mobile Safari/537.36 Edg/127.0.0.0'
}
# 发送请求
response = requests.get(url, headers=headers)
print(response.status_code)
# 获取豆瓣网页源码
with open('douban.html', 'w', encoding='utf-8') as f:
    f.write(response.content.decode())

状态码为418，而

import requests
url = 'https://movie.douban.com/top250'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36 Edg/127.0.0.0'
}
try:
    # 发送请求
    response = requests.get(url, headers=headers)
    
    if response.status_code == 418:
        print("服务器返回 418 状态码，这可能是一个玩笑或者配置问题。")
    elif response.status_code == 200:
        # 获取豆瓣网页源码
        with open('douban.html', 'w', encoding='utf-8') as f:
            f.write(response.content.decode())
    else:
        print(f"请求失败，状态码：{response.status_code}")
except Exception as e:
    print(f"发生错误：{e}")

状态码为200成功获取源码

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
迷失小行星 2024-08-21 17:18
关注
headers没写全

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

B站爬虫状态码-412怎么办 json python 爬虫
2022-10-29 20:24

回答 1 已采纳 412本身是没有满足的先决条件，你得检查上面那些头信息是否缺少
python爬虫爬取网页代码遇到了一些问题 python 爬虫
2022-08-17 17:07

回答 3 已采纳因为元素里的你要的内容是通过 ajax 请求动态加载的，可以浏览器抓包去看下，你想要的这条数据到底是哪个请求返回的，找到真正的请求，然后模拟发送就行了
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
【Python网络爬虫案例】python爬虫之爬取豆瓣电影信息
2024-08-04 17:55

左手の明天的博客豆瓣是一个电影资讯网站，用户可以在网站上查找电影信息、评论电影等。我们希望通过爬虫程序获取豆瓣电影的名称、评分和简介等信息，以便进行数据分析或制作推荐系统。
爬虫获取的图片尺寸不对 html5 python 爬虫
2022-10-22 14:15

回答 1 已采纳在浏览器里f12看一下你抓取的那个原图是不是跟你下载下来的一样。如果一样，有没有可能是网站知道你非正常访问，给你转到一个裁剪后的图片地址。
python爬虫获取内容不全是怎么回事？ python 爬虫
2023-03-01 15:21

回答 2 已采纳你访问的这个接口就只有五千多条数据，您可以在返回的数据中看到，你可以把获取到的数据输出下resp.json()：totalCount': 5860, 'totalPages': 59因此，如果要爬取更
爬虫xpath获取不到数据 python 爬虫
2022-12-12 01:38

回答 2 已采纳数据有可能是动态加载的，你没有爬到，先打印整个页面内容，搜索一下看有没有你需要的内容，没有的话，那内容就是动态加载的，request肯定爬取不到，那xpath肯定就提取不了呗！1.对于动态加载的数据，
使用爬虫爬取豆瓣读书相关信息
2024-03-04 10:09

针对“使用爬虫爬取豆瓣读书相关信息”的主题，我们将深入探讨如何利用Python编程语言及其相关的爬虫库来实现这一目标。首先，我们需要了解豆瓣读书的网页结构。豆瓣读书（douban.com/books）提供了书籍的详细信息...
爬虫问题批量获取m3u8 python 爬虫
2022-11-15 16:31

回答 6 已采纳链接发一下
为什么爬虫没法获得网页的码？ python 爬虫
2022-10-14 19:20

回答 1 已采纳不去控制台看真实请求接口这能行吗cookie换成你的 import requests headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT
爬虫 POST请求获取网页标题内容 python 爬虫
2022-10-26 16:35

回答 1 已采纳 post和get方法的使用不是你决定的，二十接口使用的是什么请求方式，如果它是get请求那就只能用get请求，是post就只能用post
豆瓣电影信息爬虫【2024年6月】教程，赋完整代码
2024-06-11 11:44

桃宝护卫队的博客豆瓣电影信息爬虫【2024年6月】教程。赋完整代码
爬虫获取数据生成csv文件时逗号自动分列怎么解决 python 爬虫
2022-04-25 14:26

回答 1 已采纳你写入的应该是一个列表吧，比如说writer.wirterow(data)你可以改成writer.wirterow([data])有帮助采纳一下哈，谢谢~
Python制作豆瓣图片的爬虫
2020-09-20 22:43

- **状态码检查**：检查响应的状态码是否为 200，若不是，则返回 `None`。 ##### 4. Image 模块详解 - **类定义**：定义了 `Image` 类，其中包含 `ImageGet()` 方法用于下载图片。 - **循环下载**：遍历所有匹配到...
豆瓣电影信息爬虫【2024年6月】教程
2024-06-11 11:38

usp1994的博客豆瓣电影院爬虫，更新于2024年6月，可联系我更新。qq:812190146
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 8月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月21日

悬赏问题

¥15 用verilog实现tanh函数和softplus函数
¥15 求京东批量付款能替代天诚
¥15 slaris 系统断电后，重新开机后一直自动重启
¥15 谁能帮我看看这拒稿理由啥意思啊阿啊
¥15 关于vue2中methods使用call修改this指向的问题
¥15 idea自动补全键位冲突
¥15 请教一下写代码，代码好难
¥15 iis10中如何阻止别人网站重定向到我的网站
¥15 滑块验证码移动速度不一致问题
¥15 Utunbu中vscode下cern root工作台中写的程序root的头文件无法包含

爬虫获取豆瓣代码状态码418

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新