scrapy 怎么爬取网页中标签栏下的所有标签?

比如说我想爬取这4个标签（这只是我要爬取的其中一个网页）

这是我的部分代码：
spider.py

def parse(self, response:HtmlResponse, **kwargs):
    sel = Selector(response)
    list_tags = sel.css('#tags > li')
    img_item = ProjectItem()
    img_item['image_path'] = sel.css('img#wallpaper::attr(src)').extract()[0]
    for tag in list_tags:
        img_item['tag'] = tag.css('.tagname::text').extract()[0]
    yield img_item

items.py

class ProjectItem(scrapy.Item):
    image_path = scrapy.Field()
    tag = scrapy.Field()

在终端输入 scrapy crawl wallhaven -o data.csv 之后，生成的csv文件每个image_path都只对应一个标签，并没有4个，请问该如何修改代码，能让这4个标签都显示在一行？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
honestman_ 2022-10-19 15:16
关注
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

爬虫攻守道 - 2023最新 - JS逆向 - Python Scrapy实现 - 爬取某天气网站历史数据
2023-01-10 17:18

biaobro的博客爬虫与反爬虫 - 2023最新爬取某天气网站历史数据 - JS逆向 - Python实现
用scrapy框架爬取拉勾网招聘信息
2020-07-14 13:53

编程歆妍的博客本文实例为爬取拉勾网上的如职位名, 薪资, 公司名称相关python的职位信息。分析思路分析查询结果页在拉勾网搜索框中搜索'python'关键字, 在浏览器地址栏可以看到搜索结果页的url为: '...
scrapy定向爬取jobbole文章
2018-06-29 11:51

SpiderLQF的博客爬取jobbole文章一、环境 window7 ... 爬虫基于scrapy框架，使用了框架中的scrapy.Request负责向目标服务器发送相应请求，解析数据时使用了scrapy的ItemLoader类来统一解析，而并不是原来的直接...
python爬取网页network_网络数据抓取-Header-Boss直聘-Python-requests爬虫
2020-12-03 06:53

weixin_39992788的博客零基础十分钟上手网络数据抓取-Python-爬虫这一篇我们看一下更复杂的情况，爬取Boss直聘这个招聘网站的招聘信息，进而简单分析人工智能行业的招聘情况。1. 理解页面打开这个页面,这是Boss直聘网站苏州搜索“人工智能...
python 爬取菜单生成菜谱，做饭买菜不用愁
2024-06-24 16:08

PDD工程师的博客 8.词云制作项目流程在项目文件中有一个 read.txt 文件，里面也有说明项目的模块划分。spider.py 为爬虫文件，爬取我们需要的数据，逻辑为：创建 csv，创建 url 后遍历访问，提取数据，写入 csv。
Python实战项目：天气数据爬取+数据可视化（完整代码）_python爬虫实战
2024-08-17 13:56

HUHU爱学习的博客 110 sheets = wb.sheet\_names() 111 for i in range(len(sheets)): 112 for name in data.keys(): 113 worksheet = wb.sheet\_by\_name(sheets\[i\]) 114 # 获取工作薄中所有表中的表名与数据名对比 115 if ...
python 爬虫实例-Python 爬虫：Scrapy 实例（二）
2020-11-01 13:23

weixin_37988176的博客原标题：Python 爬虫：Scrapy 实例（二）稍微增加点难度，做个所需项目多一点的，并将的结果以多种形式保存起来。我们就从网络天气预报开始。首先要做的是确定网络天气数据的来源。打开百度，搜索“网络天气预报”，...
HTML网页内容抓取技术详解与实践
2025-06-25 05:21

深刻如此的博客网络爬虫，也被称作网络蜘蛛或网络机器人，是一种自动化程序，其主要目的是遍历互联网并收集数据。在网络爬虫的世界里，数据可以从各种网页上...网络爬虫的开发和应用，使得从海量的网页中快速获取有价值信息成为可能。
Python 爬虫高级实战：爬取知乎内容并分析用户画像
2026-01-16 22:03

python 爬虫工程师的博客本文介绍了2026年第二届人工智能与产品设计国际学术会议(AIPD2026)相关信息，并详细讲解了基于Python的知乎用户数据爬取与画像分析方法。文章从环境搭建、爬虫原理、核心代码实现到用户画像构建，系统展示了从数据...
cx-extractor 的 Python 版本，提取网页正文，添加了提取正文图片的功能.zip
2024-05-18 21:49

在实际应用中，cx-extractor 可能会整合到更复杂的爬虫系统中，配合scrapy这样的框架进行大规模网页抓取。它也可以作为一个独立的模块，供其他Python项目调用，进行定制化的正文和图片处理任务。对于数据分析、学术...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 10月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 10月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 10月19日
展开全部

scrapy 怎么爬取网页中标签栏下的所有标签?

1条回答 默认 最新

问题事件

1条回答默认最新