python爬虫，遇到403 forbidden，求助。

 # -*- coding: utf-8 -*-
import re
import sys
import requests
reload(sys)
sys.setdefaultencoding("utf-8")

if __name__ == '__main__':
    url = 'https://movie.douban.com/subject/1433330/photos?type=W'
    # 获取网页源码
    html = requests.get(url)

    # 抓每个图片链接
    pic_url = re.findall('<img src="https://(.*?)" />', html.text, re.S)  #此链接为预览链接
    i = 0
    for each in pic_url:
        raw = re.sub('thumb','raw',each,re.S)    //将预览链接中的thumb替换成raw，便成了高清图片链接
        print 'now download..'+'https://'+raw
        pic = requests.get('https://'+raw)
        f = open('hp\\'+str(i)+'.jpg','wb')
        f.write(pic.content)
        f.close()
        i += 1

刚开始学爬虫，爬豆瓣电影的壁纸练手。现在程序可以跑下来，不返回错，但是下载的图片是失败的，response 返回 403 forbidden。

我这样想问题的原因对吗？

因为我想下高清的，但是豆瓣查看高清壁纸前，需要登录，但我的程序是没有登录的，所以出现403是吗？所以我得模拟登陆是吗？

刚注册，木有悬赏币。。谢谢

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
oyljerry 2016-04-18 03:35
关注
403就是告诉你没有权限，这个服务器做了判断，需要对用户身份做验证，一般会通过cookie等，所以你没有登陆就没办法访问。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫遇到403 Forbidden？5个绝招帮你破局！(附详细解决代码)
2025-05-19 14:04

「已注销」的博客（总结时间）解决403错误就像和网站玩捉迷藏，关键是让你的爬虫看起来更像真人操作。记住：没有破解不了的网站，只有不够逼真的伪装！（超级重要）User-Agent就像你的网络身份证，很多网站会拦截默认的Python UA！...
【Python爬虫】403 Forbidden
2020-07-03 14:22

会写代码的饭桶的博客状态码403 Forbidden代表客户端错误，指的是服务器端有能力处理该请求，但拒绝授权访问。 Python爬取数据时，有时会遇上403错误，通常的解决方法是在请求时的header中添加User-Agent，让服务器端认为该爬取的动作...
一招鲜吃遍天！彻底解决Python爬虫403 Forbidden报错的8种姿势（亲测有效）
2025-05-19 13:58

herobrineAC789的博客检查User-Agent → 2. 添加Referer/Cookie → 3. 使用代理 → 4. 降频 → 5. 换工具如果这些方法都试过了还是不行… 兄弟，考虑下是不是该给...（认真脸）你在爬虫过程中还遇到过哪些奇葩错误？欢迎在评论区留言交流！
Python爬虫遇到403 Forbidden？5个绝招帮你破局！(附详细解决代码)@[TOC](文章目录)
2025-05-19 19:13

「已注销」的博客）@TOC（配图建议：显示浏览器403错误页面+代码编辑器界面）。这让他抓狂得差点把键盘摔了——明明昨天还能正常抓取数据！如果你也遇到这个磨人的小妖精，别慌！今天咱们就来手把手拆解这个经典错误。
python 爬虫 403 Forbidden
2022-03-04 18:09

m0_46158200的博客 headers={ ‘User-Agent’:‘Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.137 Safari/537.36 LBBROWSER’ } res = requests.get(url.format(page),headers=...
python爬虫 403 Forbidden 解决方法
2021-05-29 17:51

qq_38472535的博客 python爬虫 403 Forbidden 解决方法
当爬虫遇到403 Forbidden时，我总结的七个破局妙招（血泪经验分享）
2025-05-19 15:20

variablevoyager的博客昨天我正愉快地写着爬虫脚本，突然就遇到了这个红色警告——就像在超市结账时发现忘带钱包一样让人抓狂（别问我怎么知道的）。（你懂的）技术无罪，但使用需谨慎！（避坑指南）免费代理存活时间短，建议使用付费服务...
Python 爬虫 403 Forbidden
2022-01-06 20:38

Ciao子瑜的博客 Python爬虫 403 Forbidden的解决办法
手撕403禁区！Python爬虫遇到HTTPError 403的六种破局姿势（亲测有效）
2025-05-19 10:57

「已注销」的博客解决403错误就像和服务器玩猫鼠游戏，核心思路就是让我们的请求看起来"像个人"。但要注意，本文方法仅供学习交流，实际使用请遵守相关法律法规。“没有爬不到的数据，只有想不到的骚操作！（当然，要在法律允许范围...
解决“403 Forbidden”错误：如何在Python爬虫中正确设置请求头
2025-07-28 11:20

程序员威哥的博客本文探讨了Python爬虫开发中常见的"403 Forbidden"错误及其解决方案。该错误通常由网站反爬虫机制触发，原因包括IP封禁、异常User-Agent、缺失必要请求头或高频访问等。关键解决方法包括：正确设置请求头...
python爬虫提示403
2023-01-03 21:56

金刚廉神兽的博客如果你在使用 Python 爬虫时遇到了 HTTP 状态码 403，这意味着你的爬虫被服务器拒绝了。有很多原因可能会导致这种情况，例如：服务器的安全设置禁止了你的 IP 地址访问服务器需要你提供身份验证凭据(例如用户名和...
当Python爬虫遭遇HTTP 403错误：这7种破解姿势你一定要会！！！
2025-05-19 12:27

kernelguru的博客遇到403先暂停而不是继续硬刚尊重robots.txt！有些网站明确禁止爬虫就不要强行抓取最近帮朋友调试一个爬虫时，发现即使用上了所有方法还是403。最后发现是对方网站启用了TLS指纹验证（这种高级反爬就需要更复杂的...
Python爬虫必看！一招解决HTTP 403 Forbidden错误（附详细解决方案）
2025-05-20 06:34

「已注销」的博客（配图：程序员抓头发的表情包，图说：当你遇到403错误时的真实状态）把生成的headers传过去，看看返回的信息是否包含你设置的请求头。，别爬用户隐私数据，别影响网站正常运营。咱们要做有格调的技术人！上Selenium...
使用Python爬虫会遇到的问题和解决方法（包含案例）
2024-05-01 22:42

svygh123的博客一、HTTP错误（如403 Forbidden）二、反爬虫机制（如验证码、动态加载数据）三、网络延迟或不稳定
403 Forbidden终结指南：Python爬虫反反爬全流程解析
2025-06-12 16:03

黄红说竞赛的博客很多的爬虫请求头是默认的一些很明显的爬虫头为‘python-requests/2.18.4’，诸如此，当运维人员发现携带有这类 headers 的数据包时，直接拒绝访问，返回 403 错误。很多网站的反爬虫机制都会设置了访问间隔时间，一...
python 爬虫禁止访问解决方法（403）
2018-06-07 14:50

NineDays66的博客更多思考在上一篇博客中说到，程序使用一段时间后会遇到HTTP Error 403: Forbidden错误。因为在短时间内直接使用Get获取大量数据，会被服务器认为在对它进行攻击，所以拒绝我们的请求，自动把电脑IP封了。解决这个...
爬虫爬取数据出现403警告
2024-08-19 17:05

咸芝麻鱼的博客 1.更换网络的IP地址 2.浏览器复用...
【python爬虫】—爬虫报错：403访问太过频繁，禁止访问
2021-08-18 17:10

天边彩的博客 @【python爬虫】—爬虫报错：403访问太过频繁，禁止访问前言使用requests包建立访问时，正常的访问状态会返回状态代码200，但是在爬一些网站时，经常会返回403（众所周知的404代表的是网站disappear了。而403...
python爬虫遇到的一些杂七杂八的问题
2021-12-12 19:58

lzhfuture的博客具体的全部源码单独写一篇进行展示，这里只记录一下写爬虫期间遇到的一些杂七杂八的问题 1.HTTPError: Forbidden 这个主要就是爬豆瓣的时候，访问可能太频繁了，被认出来是爬虫，就拒绝访问了解决方法主要就是：...
没有解决我的问题, 去提问

python爬虫，遇到403 forbidden，求助。

5条回答 默认 最新

5条回答默认最新