python爬取网站图片：爬出来图片全部都不全且只能爬一张？

## 爬取的时候只有一张，有时候特别慢，而且爬出来文件全部都不全，

图片是我爬了好几次的结果

上代码：

import requests
from urllib import request
from bs4 import BeautifulSoup
import re
import random
# url网址
st_url = "https://konachan.net/post"
# 设置headers
ua = [
"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1",
"Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11",
"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1092.0 Safari/536.6",
"Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1090.0 Safari/536.6",
"Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/19.77.34.5 Safari/537.1",
"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.9 Safari/536.5",
"Mozilla/5.0 (Windows NT 6.0) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.36 Safari/536.5",
"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3",
"Mozilla/5.0 (Windows NT 5.1) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3",
"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_0) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3",
"Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3",
"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3",
"Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3",
"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3",
"Mozilla/5.0 (Windows NT 6.1) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3",
"Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.0 Safari/536.3",
"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24",
"Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24",
]
# 爬取网页代码
headers = {"User-Agent":random.choice(ua)}
rurl = request.Request(st_url,headers=headers)
openurl = request.urlopen(rurl)
soup = BeautifulSoup(openurl,"lxml")
# print(soup)

# 设置beautiful soup标签并爬取
attrs ={"class":"directlink largeimg" or "directlink smallimg"}
list1 =soup.find_all("a",attrs=attrs)
path = "D:\\py\\code\\php\\untitled\\img\\"
# 设置循环下载保存
number = 0
while (number <1):
    for i in list1:
        url_ = (i["href"])
        name = soup.find_all("li", attrs={"style": "width: 170px;"})
    for o in name:
        img_ = (o["id"])
    number =number+1
request.urlretrieve(url_,path+img_+".jpg")
print(img_+".jpg"+"下载完成!")

下面是爬出来的数据：
图片说明

求教各位朋友救火。多谢！！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
竟然有高手 2020-03-31 11:10
关注
你这写的很让我迷茫啊，你用for遍历了储存图片的列表（for o in name:）但是，重点是你把请求图片的代码（request.urlretrieve(url_,path+img_+".jpg"))放在循环的外面，你这样操作_img的值就是列表的最后一项，所以只有一张图不是很正常的事吗？知道怎么改了吧

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python3 爬虫问题：如何爬取文本从图片里面，破解这种图片反爬虫手段！ python 有问必答爬虫
2021-08-24 15:09

回答 5 已采纳只能使用OCR识别了，没有什么好的办法，就是一张图片。你可以试试CSDN的图片识别，接口网址：https://bizapi.csdn.net/mp/ask/v1/ai/ocrText 提问题时检查图片
python爬图片，代码没报错但是没有结果 python
2022-06-29 05:32

回答 2 已采纳直接运行这个脚本文件的话，图片并不是存在桌面上。而是在这个py文件同目录下，即“C:/Users/AUB/Desktop/Final Year/Python 练习/p54爬虫”
Python爬取图片问题 python
2021-04-07 06:15

回答 2 已采纳题主存在问题是：保存图片路径是写死的，循环中会一直覆盖写入"python爬虫图片实验2.jpg"这张图片，所以最后只能得到一张图片修改：保存图片路径需要改一下，让每一次循环时，图片写入不
Python爬虫自动爬取图片并保存
2022-01-01 20:05

清忖灬的博客一、准备工作用python来实现对某图片的爬取并保存，以情绪图片为例，搜索可得到下图所示f12打开源码在此处可以看到这次我们要爬取的图片的基本信息是在img - scr中二、代码实现这次的爬取主要用了如下的第三方库 ...
使用Python从网站批量爬取图片并保存到本地时出现了问题 pycharm python
2021-08-15 16:39

回答 1 已采纳可以把你的程序搞成一个死循环，每开始下载图片就计算时间，执行完下载命令在算一次时间，两次时间做差，当时间大于你估计报错的时间的时候就continue，执行完全部的下载命令后就break，中间出现报错的
求位巨佬..我的只能爬取第一页的某一张壁纸而不是第一页的所有如何解决 python 爬虫
2021-09-25 02:21

回答 1 已采纳逐步调试呀。 f=open("壁纸%s.jpg",mode="wb") f.write(requests.get(src).content) %s 你是想输出什么呢？你一直都是在打开
Python爬取内容保存到本地出现错误，想先跳过再集中处理。但出了问题。 pycharm python
2021-08-16 16:06

回答 2 已采纳参数不对啊，报错的时候不是输出了吗 gpp 这个路径不对可以在with open 那部分代码块加上异常捕获try: with open ()......... except Exception as
Python应用开发——爬取网页图片
2022-09-06 19:00

柒壹漆的博客当我们需要从网页上面下载很多图片的时候，一个一个手动保存实在是太累人了。那么有没有批量下载的办法呢？答案是有的，Python爬虫就可以完美的做到这一点，而且作为一个Python的初学者，我可以很负责任的告诉你，...
爬取商品图片，alt中名字相同，执行后只有一张图，把改为src后就报错， python 有问必答
2021-06-19 09:36

回答 2 已采纳改成src后，图片名称这样写，img_name=img_src.split('/')[-1]，代码中的写法有误。
请问为什么当我试图储存爬到的多个页面的数据时，只能保存最后一页的数据 python
2020-01-11 23:17

回答 1 已采纳我把你写的爬虫代码给简单改了下，用正则匹配你这个写的有问题，后期需要加强下正则学习，我用lxml解析的源代码，因为你写的是同步执行的，所以我也是同步执行的，没有改成异步的，这样爬虫用异步方式是最好的
爬取京东书籍分类的那个页面，发现书籍分类信息已经被弄成一个像json文件一样的东西了，但我却怎么也访问不了那个东西的地址，来请求一下大家的帮助 json python 有问必答爬虫
2021-08-18 21:40

回答 2 已采纳添加请求头，将params参数构建成这样即可：counter随机数，请求当时时间戳。 params = ( ('source', 'bookSort'), ('callback', f
python爬虫系列Selenium定向爬取虎扑篮球图片详解
2020-12-24 13:21

作为一名从小就看篮球的球迷，会经常逛虎扑篮球及湿乎乎等论坛，在论坛里面会存在很多精美图片，包括NBA球队、CBA明星、花边新闻、球鞋美女等等，如果一张张右键另存为的话真是手都点疼了。作为程序员还是写个程序来...
如何获取元素在网页与背景图的对应关系 html5 javascript python
2022-04-29 14:52

回答 2 已采纳比较麻烦，实际他是通过css定位显示大图片中的指定位置的一小部分内容，而css还不知道他在那个文件中
python爬取网页文字和图片_简单的爬虫：爬取网站内容正文与图片
2020-12-06 09:14

weixin_39889544的博客我们来写个简单的爬虫####需要用到的模块需要用到python的urllib和lxml模块，urllib为python的自带模块，lxml需要自行安装：pipinstalllxml简单介绍urllib和lxml的使用我们使用urllib来爬去一个网页比如：In[1]:...
python爬取一张图片并保存_python爬取网站上的图片并保存到本地
2020-11-20 18:58

weixin_39708557的博客那么就需要确认初始化定义的文件夹是否存在，如果不存在，需要创建。 def mkdir(self, path): # 创建文件夹 path = path.strip() is_exists = os.path.exists(path) if not is_exists: print('创建名字叫做', path, ...
没有解决我的问题, 去提问

悬赏问题

¥15 MCNP里如何定义多个源？
¥20 双层网络上信息-疾病传播
¥50 paddlepaddle pinn
¥20 idea运行测试代码报错问题
¥15 网络监控：网络故障告警通知
¥15 django项目运行报编码错误
¥15 请问这个是什么意思？
¥15 STM32驱动继电器
¥15 Windows server update services
¥15 关于#c语言#的问题：我现在在做一个墨水屏设计，2.9英寸的小屏怎么换4.2英寸大屏

python爬取网站图片：爬出来图片全部都不全且只能爬一张？

## 爬取的时候只有一张，有时候特别慢，而且爬出来文件全部都不全，

图片是我爬了好几次的结果

2条回答 默认 最新

悬赏问题

2条回答默认最新