403代码该怎么解决，我换了headers，延时也那样，我本意是爬虫一个网战的图片，我现在已知的可能有关的是有一些人去爬虫那个网站，网站会有等待几秒验证真人，我把代码写上




import requests
from bs4 import BeautifulSoup
import time
url='https://pic.netbian.com/4kdongman/index.html'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'}

response=requests.get(url=url,headers=headers,timeout=20)
print(response.status_code)
response.encoding='gbk'
response.encoding='utf-8'
text=response.text
soup=BeautifulSoup(text,'html.parser')
#开始解析内容
img_list=soup.select('.slist ul li a img')
time.sleep(5)
print(img_list)
#遍历图片对象，拿到链接地址
for img in img_list:
    img_url=img.get('src')
#    print(img_url)
    img_name=img['alt']
    time.sleep(5)
#发送请求
    try:
        response=requests.get(url=img_url,headers=headers,timeout=200)
        response.raise_for_status()
    except requests.exceptions.RequestException as e:
        print(f"获取图片失败: {e}")
        continue
    #要保存图片,要有对应的文件名，replace()方法可以替换字符串中的某个字符，照片名称不能有'*'等特殊字符
#    img_name=img_url.replace('/','_')


# 创建目录
if not os.path.exists('./动漫图集3'):
    os.makedirs('./动漫图集3')

#    img_name=img['alt']
    with open(f'./动漫图集3/{img_name}.png','wb') as f:
        f.write(response.content)
    time.sleep(10)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
道友老李 JWE233286一种基于机器视觉的水表指针读数识别及修正的方法专利发明者 2025-03-16 11:27
关注
让【道友老李】来帮你解答，本回答参考gpt编写，并整理提供，如果还有疑问可以点击头像关注私信或评论。
如果答案让您满意，请采纳、关注，非常感谢！
这段代码是使用Python中的requests和BeautifulSoup库来爬取网站上的图片，并将图片保存到本地。代码中首先使用requests库发送HTTP请求获取网页内容，然后使用BeautifulSoup库解析网页内容，提取出图片链接。接着遍历图片链接列表，依次发送请求获取图片并保存到本地。在代码中，需要注意的是要替换图片名称中的特殊字符，以避免保存文件时出现问题。另外，代码中也创建了一个目录用于保存图片。如果想要完整运行这段代码，需要先安装requests和BeautifulSoup库。同时还需要导入os模块，因为代码中使用了os.makedirs()方法来创建目录。以下是完整的实现代码：
import requests from bs4 import BeautifulSoup import os import time url = 'https://pic.netbian.com/4kdongman/index.html' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'} response = requests.get(url=url, headers=headers, timeout=20) print(response.status_code) response.encoding = 'gbk' response.encoding = 'utf-8' text = response.text soup = BeautifulSoup(text, 'html.parser') img_list = soup.select('.slist ul li a img') time.sleep(5) print(img_list) for img in img_list: img_url = img.get('src') img_name = img['alt'] time.sleep(5) try: response = requests.get(url=img_url, headers=headers, timeout=200) response.raise_for_status() except requests.exceptions.RequestException as e: print(f"获取图片失败: {e}") continue if not os.path.exists('./动漫图集3'): os.makedirs('./动漫图集3') with open(f'./动漫图集3/{img_name}.png', 'wb') as f: f.write(response.content) time.sleep(10)

请注意，上述代码仅供参考，实际运行时需要根据网站结构和图片链接的规律进行适当的调整。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

编写可读性代码的艺术
2016-07-16 10:30

LightingLYG的博客原文地址： ... PDF文件下载地址： ... 译者序在做IT的公司里，尤其是软件开发部门，一般不会要求工程师衣着正式。在我工作过的一些环境相对宽松的公司里，很多程序员的衣着连得
那些年我准备的前端面试题
2016-08-07 15:23

liangklfang的博客 commonJS相关： (1)在commonJS规范中，require,exports,module，__filename,__dirname都是通过动态编译后添加到模块的...而且必须弄清楚一点：exports是一个对象，如果重新赋值，那么不会反映到外面，但是module.expo
【面试一】
2022-04-26 08:24

木12138的博客第一种方法 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport
Burp Suite使用介绍（一）
2018-07-21 13:36

yunshouhu的博客 Burp Suite 是用于攻击web 应用程序的集成平台。...所有的工具都共享一个能处理并显示HTTP 消息，持久性，认证，代理，日志，警报的一个强大的可扩展的框架。本文主要介绍它的以下特点： 1.Target(目标)——...
前端面试笔记随笔---kalrry
2022-04-05 17:37

kalrry的博客面试笔记---kalrry第一部分：HTML5+CSS31、父元素和子元素宽高不固定，如何实现水平垂直居中2、分别实现骰子中的'一点' 和 '三点' 的布局。3、简述选择器~和+的区别。4、简述box-sizing的有效值以及所对应的盒模型...
渗透测试 2 --- XSS、CSRF、文件上传、文件包含、反序列化漏洞
2022-07-11 07:34

「已注销」的博客 1、渗透测试实用浏览器插件 chrome、edge 插件：搜索 cookie，安装 cookie editor，打开插件，可以导出 cookie HackBar ：Hackbar是网络安全学习者常备的工具 ... 解决Firefox插件-H...
渗透测试 ( 0 ) --- XSS、CSRF、文件上传、文件包含、反序列化漏洞
2022-06-12 23:00

擒贼先擒王的博客此符号作用是后台任务符号使shell在后台执行该任务，这样用户就可以立即得到一个提示符并继续其他工作 root@ubuntu: d & e & f [1] 14271 [2] 14272 后台执行任务d和e，而在前台执行任务f. shell将作业数目显示在...
Burp Suite使用介绍说明
2021-05-21 10:49

crystal_o的博客 1.Target(目标)——显示目标目录结构的的一个功能 2.Proxy(代理)——拦截HTTP/S的代理服务器，作为一个在浏览器和目标应用程序之间的中间人，允许你拦截，查看，修改在两个方向上的原始数据流。 3.Spider(蜘蛛)——...
Burp Suite使用介绍
2020-04-14 17:17

Moilyh的博客 Burp Suite 是用于攻击web 应用程序的集成平台。它包含了许多工具，并为这些工具设计了许多接口，...1.Target(目标)——显示目标目录结构的的一个功能 2.Proxy(代理)——拦截HTTP/S的代理服务器，作为一个在浏览器和...
Burp Suite初探
2017-01-17 10:24

weixin_30244681的博客一、安装部署需要配置java环境，首先安装java，然后配置java环境变量 JAVA_HOME：即安装jdk路径，在这路径下你应该能够找到bin、lib等目录 path： %java_home%\bin;%java_home%\jre\bin; 如...
BurpSuit
2017-01-10 17:56

莫特@的博客 Getting Started ...所有的工具都共享一个能处理并显示HTTP 消息，持久性，认证，代理，日志，警报的一个强大的可扩展的框架。本文主要介绍它的以下特点： ? 1 1.Target(目标)——显示目标
Burp Suite使用介绍总结
2016-01-23 17:47

「已注销」的博客 Burp Suite使用介绍（一）小乐天 · 2014/05/01 19:54 ...所有的工具都共享一个能处理并显示HTTP 消息，持久性，认证，代理，日志，警报的一个强大的可扩展的框架。本文主要介绍它的以下特点： 1.T
burpsuite 学习笔记
2014-11-23 23:38

weixin_33970449的博客本文参考：http://drops.wooyun.org/tools/1548Burp Suite 使用介绍Getting StartedBurp Suite用于***web...所有的工具double共享一个能处理并显示HTTP消息，持久性，认证，代理，日志，警报的一个强大的可扩展的框...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月16日

403代码该怎么解决，我换了headers，延时也那样，我本意是爬虫一个网战的图片，我现在已知的可能有关的是有一些人去爬虫那个网站，网站会有等待几秒验证真人，我把代码写上

4条回答 默认 最新

问题事件

4条回答默认最新