使用scrapy请求图片，自定义传递图片名称，结果存在问题，不知道问题出在哪？

获取站长素材的图片
问题描述：试图用下面的方法传递图片名称，结果图片下载仅有一张；在源文件中打印图片名和链接全部正常，在管道类的file_path方法中打印图片名，图片名可以打印，但是最后一个图片名称重复多次

我知道可以通过请求传参的方式传递图片名称，只是单纯想知道如下代码问题在哪，谢谢各位大神
源文件中代码

import scrapy
from ImagesPro.items import ImagesproItem

class ImgSpider(scrapy.Spider):
    name = 'img'
    allowed_domains = ['www.xxx.com']
    start_urls = ['https://sc.chinaz.com/tupian/']

    def parse(self, response):

        div_list = response.xpath('//div[@id="container"]/div')
        for div in div_list:

            divUrl = 'https:' + div.xpath('./div/a/img/@src2').extract()[0]
            imgName = div.xpath('./div/a/@alt').extract()[0]
            item = ImagesproItem()
            item['imgUrl'] = divUrl
            item['imgName'] = imgName
            yield item

管道类中代码

class ImgPipeline(ImagesPipeline):

    item = ''
    # 对图片进行请求操作
    def get_media_requests(self, item, info):
        self.item = item['imgName'] #试图通过self方法传参
        yield scrapy.Request(item['imgUrl'])

    # 定制图片名称
    def file_path(self, request, response=None, info=None, *, item=None):
        
        # file_name = request.url.split('/')[-1]
        file_name = self.item + '.jpg'
        # print(file_name)
        return file_name

    def item_completed(self, results, item, info):
        return item # 将返回值传递给下一个被执行的管道类

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
weixin_45864635 2021-07-04 12:36
关注
感觉和人家讲的偏离好多优酷里有个讲imagepipeline的

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

在scrapy中能不能进行多次post请求？ python
2020-12-13 19:29

回答 1 已采纳通过scrapy 可以多次发送 post 请求的，在start_requests方法中通过 yield 去调用另一个方法即可
怎么解决Python中scrapy导入出错的问题？ pycharm python
2021-07-14 22:31

回答 1 已采纳看提示是说没有 crawl 命令，要解决这个问题，需要确保2点： 1.把爬虫.py复制到spiders文件夹里如执行scrapy crawl demo ,spiders里面就要有demo.py文件
关于#pythonscrapy#的问题，如何解决？ python 开发语言爬虫
2023-04-02 16:26

回答 2 已采纳好问题！！抱歉我也不太懂，你问问chatGPT吧：https://new.quke123.com/ 或者其他Python群友：https://app.yinxiang.com
python使用scrapy发送post请求的坑
2020-09-20 03:23

本文将重点讨论使用Scrapy发送POST请求时可能会遇到的问题以及与requests库的不同之处。首先，让我们回顾一下requests库发送POST请求的方法。requests库提供了简单直观的API，使得发送POST请求变得非常便捷。例如...
python3 scrapy Request 请求时怎么保持headers 的参数首字母不大写 python 数据挖掘
2019-05-15 16:44

回答 1 已采纳在spider文件中spider类的上面写下不希望首字母大写的header ``` from twisted.web.http_headers import Headers as TwistedH
scrapy爬取图片，爬取不到 python 有问必答
2021-05-23 20:32

回答 2 已采纳你已经爬到图片连接了，这个看到的管道文件的代码怎样写，要对图片链接发送请求访问，然后保存才行
用scrapy爬取站长素材无法下载图片 python 爬虫
2021-08-03 18:51

回答 2 已采纳找到原因了，是要在setting中加上MEDIA_ALLOW_REDIRECTS = True，貌似是中间件的内容，我还没学到，所以不清楚什么意思，有大佬可以解释一下吗看所有日志后会发现其实有地方报错
Scrapy爬取图片自定义图片文件名时出现的问题
2022-01-01 13:08

Flower and you的博客出现的问题：只下载了一张图片，图片的名称为最后一张图片的名称，但内容并不是最后一张图片的内容。在打印时，最后一张图片的相关信息出现多次。对应文件的相关信息： Items文件相关内容： Spider文件内容： ...
关于#scrapy#的问题，如何解决？ python 爬虫
2023-03-07 18:36

回答 2 已采纳从代码看，你的爬虫似乎只是爬取了起始页面上第一个标题链接的数据。这可能是因为在parse函数中只获取了第一个数据块，而没有对其他数据块进行处理。你可以尝试使用循环迭代数据块，以便对每个数据块进行相同
关于Scrapy 框架运行不出结果的问题，好像没有报错 python 正则表达式
2020-05-09 18:12

回答 2 已采纳如图：如果你完整的看完scrapy的日志（第一张图），根本原因：你设置了robotstxt服从为真，直接原因：目标网站的robot限制了你的访问
python爬虫scrapy python 有问必答
2021-07-22 10:03

回答 2 已采纳看下数据是否是动态加载的，多抓几次包，分析下；可能需要通过添加page参数，进行爬取！
scrapy框架使用(图片储存,下载中间件)
2023-06-15 13:07

当Scrapy爬虫在解析网页时遇到图片链接，它会将这些链接传递给图片管道。图片管道会自动下载图片，并按照你设定的规则进行处理，如重命名、缩略图生成等。你还可以自定义图片的过滤条件，比如根据图片大小、类型等...
python 基于Scrapy框架抓取图片
2018-01-17 15:31

同时，使用`meta`属性传递额外信息，如图片名称： ```python def parse(self, response): for img_url in response.css('img::attr(src)').getall(): yield scrapy.Request(img_url, callback=self.save_image, ...
Python_Scrapy.zip
2021-08-11 11:38

本资源"Python_Scrapy.zip"包含了一个使用Scrapy进行爬虫开发的完整实例，涵盖了从基础到进阶的各种功能，如页面翻页、图片下载以及项目部署。首先，Scrapy是一个开源的Python框架，它允许开发者通过定义Item（要...
Python-爬取百度图片的scrapy爬虫实现
2019-08-10 07:28

在这个名为"Python-爬取百度图片的scrapy爬虫实现"的项目中，我们将深入探讨如何使用Scrapy来抓取百度图片。首先，让我们了解Scrapy的基本架构。 Scrapy由多个组件构成，包括Spider、Item、Item Pipeline、...
没有解决我的问题, 去提问

悬赏问题

¥15 python的EOFError该怎么解决？
¥15 SSMS-Setup-CHS安装程序双击没反应
¥15 Fluent，液体进入旋转区域体积分数不连续
¥15 课上突考，本人大脑过载，求51单片机能手
¥15 java linux下将docx文件转pdf
¥15 maven无法下载依赖包
¥15 关于pycharm, Callable[[str],bool]作为方法参数使用时, lambda 类型不提示问题
¥15 layui数据重载无效
¥15 寻找了解qq家园纵横四海的程序猿。
¥15 optisystem

使用scrapy请求图片，自定义传递图片名称，结果存在问题，不知道问题出在哪？

2条回答 默认 最新

悬赏问题

2条回答默认最新