scrapy 怎么爬取网页中标签栏下的所有标签?

比如说我想爬取这4个标签（这只是我要爬取的其中一个网页）

这是我的部分代码：
spider.py

def parse(self, response:HtmlResponse, **kwargs):
    sel = Selector(response)
    list_tags = sel.css('#tags > li')
    img_item = ProjectItem()
    img_item['image_path'] = sel.css('img#wallpaper::attr(src)').extract()[0]
    for tag in list_tags:
        img_item['tag'] = tag.css('.tagname::text').extract()[0]
    yield img_item

items.py

class ProjectItem(scrapy.Item):
    image_path = scrapy.Field()
    tag = scrapy.Field()

在终端输入 scrapy crawl wallhaven -o data.csv 之后，生成的csv文件每个image_path都只对应一个标签，并没有4个，请问该如何修改代码，能让这4个标签都显示在一行？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
honestman_ 2022-10-19 15:16
关注
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

scrapy 怎么爬取网页中标签栏下的所有标签? python 爬虫
2022-10-19 14:43

回答 1 已采纳
如何利用scrapy爬取带标签的网页内容并保存到自己的服务器上？ mysql python sql
2018-02-09 09:34

回答 3 已采纳 1. 把整个爬取到的网页内容直接存储到数据库肯定是可以的，你之所以没有成功，应该是因为你的数据库中的相应字段错了，整个网页内容都比较长，一般都是要用text字段，甚至是LongText)（最大长度42
scrapy爬取图片，爬取不到 python 有问必答
2021-05-23 20:32

回答 2 已采纳你已经爬到图片连接了，这个看到的管道文件的代码怎样写，要对图片链接发送请求访问，然后保存才行
爬虫攻守道 - 2023最新 - JS逆向 - Python Scrapy实现 - 爬取某天气网站历史数据
2023-01-10 17:18

biaobro的博客爬虫与反爬虫 - 2023最新爬取某天气网站历史数据 - JS逆向 - Python实现
用scrapy爬取站长素材无法下载图片 python 爬虫
2021-08-03 18:51

回答 2 已采纳找到原因了，是要在setting中加上MEDIA_ALLOW_REDIRECTS = True，貌似是中间件的内容，我还没学到，所以不清楚什么意思，有大佬可以解释一下吗看所有日志后会发现其实有地方报错
scrapy 爬取图片报错 error processing python
2021-12-20 01:08

回答 1 已采纳 http: 去那里啦?
scrapy爬取知乎首页乱码
2017-12-01 03:21

回答 2 已采纳 ```python HEADERS = { 'Host': 'www.zhihu.com', 'Accept': 'text/html,application/xhtml+xml
用scrapy框架爬取拉勾网招聘信息
2020-07-14 13:53

编程歆妍的博客本文实例为爬取拉勾网上的如职位名, 薪资, 公司名称相关python的职位信息。分析思路分析查询结果页在拉勾网搜索框中搜索'python'关键字, 在浏览器地址栏可以看到搜索结果页的url为: '...
scrapy 爬取图片时图片的url总是显示None python 有问必答
2021-12-04 01:41

回答 1 已采纳 img_url = div.xpath('./div/a/img/src').extract_first() src前面少了 @ 改成 img_url = div.xpath('./
利用scrapy如何爬取图表中的数据 python 其他有问必答
2021-07-07 23:48

回答 1 已采纳 scrapy得出的响应内容是在network的doc里面，如图如果对你有帮助，可以点击我这个回答右上方的【采纳】按钮，给我个采纳吗，谢谢
scrapy 爬取商品视频url,详情失败 python
2022-02-17 10:28

回答 3 已采纳 js加载的，先打印看下获取的整个网页。我试了下，在下图这个位置可以找到视频链接，可以用正则或者别的方法取出来
[Python程序设计] 用Scrapy爬取学堂在线计算机类课程页面的信息
2020-11-14 13:41

Lupinus_Linn的博客爬虫仅供学习交流使用，请勿用于商业用途，请勿高频爬取数据。由使用爬虫产生的纠纷笔者概不负责。实验报告原文节选 2.2 遇到障碍：JS动态渲染页面编写spider.py时遇到了诡异的问题，xpath可以找到符合//*[@id...
Scrapy框架时爬取网页时报错 python 有问必答
2021-05-26 16:56

回答 2 已采纳你的数据清洗方法用错了，参考一下：https://blog.csdn.net/qq_43004728/article/details/84586628，如有帮助，望采纳
python爬取网页network_网络数据抓取-Header-Boss直聘-Python-requests爬虫
2020-12-03 06:53

weixin_39992788的博客零基础十分钟上手网络数据抓取-Python-爬虫这一篇我们看一下更复杂的情况，爬取Boss直聘这个招聘网站的招聘信息，进而简单分析人工智能行业的招聘情况。1. 理解页面打开这个页面,这是Boss直聘网站苏州搜索“人工智能...
scrapy定向爬取jobbole文章
2018-06-29 11:51

SpiderLQF的博客爬取jobbole文章一、环境 window7 ... 爬虫基于scrapy框架，使用了框架中的scrapy.Request负责向目标服务器发送相应请求，解析数据时使用了scrapy的ItemLoader类来统一解析，而并不是原来的直接...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 10月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 10月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 10月19日
展开全部

悬赏问题

¥15 在现有系统基础上增加功能
¥15 远程桌面文档内容复制粘贴，格式会变化
¥15 关于#java#的问题：找一份能快速看完mooc视频的代码
¥15 这种微信登录授权谁可以做啊
¥15 请问我该如何添加自己的数据去运行蚁群算法代码
¥20 用HslCommunication 连接欧姆龙 plc有时会连接失败。报异常为“未知错误”
¥15 网络设备配置与管理这个该怎么弄
¥20 机器学习能否像多层线性模型一样处理嵌套数据
¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页

scrapy 怎么爬取网页中标签栏下的所有标签?

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新