weixin_44157032 2022-10-19 14:43 采纳率: 68.8%
浏览 19
已结题

scrapy 怎么爬取网页中标签栏下的所有标签?

img

img

比如说我想爬取这4个标签(这只是我要爬取的其中一个网页)

这是我的部分代码:
spider.py

def parse(self, response:HtmlResponse, **kwargs):
    sel = Selector(response)
    list_tags = sel.css('#tags > li')
    img_item = ProjectItem()
    img_item['image_path'] = sel.css('img#wallpaper::attr(src)').extract()[0]
    for tag in list_tags:
        img_item['tag'] = tag.css('.tagname::text').extract()[0]
    yield img_item

items.py

class ProjectItem(scrapy.Item):
    image_path = scrapy.Field()
    tag = scrapy.Field()

在终端输入 scrapy crawl wallhaven -o data.csv 之后,生成的csv文件每个image_path都只对应一个标签,并没有4个,请问该如何修改代码,能让这4个标签都显示在一行?

  • 写回答

1条回答 默认 最新

  • honestman_ 2022-10-19 15:16
    关注

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 10月25日
  • 已采纳回答 10月19日
  • 修改了问题 10月19日
  • 修改了问题 10月19日
  • 展开全部

悬赏问题

  • ¥15 Linux环境下CA证书更新问题
  • ¥15 sqlserver语句提取结果以外数据
  • ¥60 微信小程序如何上传QQ聊天文件
  • ¥300 开发的系统遭到无良商家的破解,请问如何防止再次发生,并追回损失
  • ¥15 java代码写在记事本上后在cmd上运行时无报错但又没生成文件
  • ¥15 关于#python#的问题:在跑ldsc数据整理的时候一直抱这种错误,要么--out识别不了参数,要么--merge-alleles识别不了参数(操作系统-linux)
  • ¥15 PPOCRLabel
  • ¥15 混合键合键合机对准标识
  • ¥100 现在不懂的是如何将当前的相机中的照片,作为纹理贴图,映射到扫描出的模型上
  • ¥15 安卓OpenCV人脸识别分类器加载