weixin_44157032 2022-10-19 14:43 采纳率: 68.8%
浏览 19
已结题

scrapy 怎么爬取网页中标签栏下的所有标签?

img

img

比如说我想爬取这4个标签(这只是我要爬取的其中一个网页)

这是我的部分代码:
spider.py

def parse(self, response:HtmlResponse, **kwargs):
    sel = Selector(response)
    list_tags = sel.css('#tags > li')
    img_item = ProjectItem()
    img_item['image_path'] = sel.css('img#wallpaper::attr(src)').extract()[0]
    for tag in list_tags:
        img_item['tag'] = tag.css('.tagname::text').extract()[0]
    yield img_item

items.py

class ProjectItem(scrapy.Item):
    image_path = scrapy.Field()
    tag = scrapy.Field()

在终端输入 scrapy crawl wallhaven -o data.csv 之后,生成的csv文件每个image_path都只对应一个标签,并没有4个,请问该如何修改代码,能让这4个标签都显示在一行?

  • 写回答

1条回答 默认 最新

  • honestman_ 2022-10-19 15:16
    关注

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 10月25日
  • 已采纳回答 10月19日
  • 修改了问题 10月19日
  • 修改了问题 10月19日
  • 展开全部

悬赏问题

  • ¥15 在现有系统基础上增加功能
  • ¥15 远程桌面文档内容复制粘贴,格式会变化
  • ¥15 关于#java#的问题:找一份能快速看完mooc视频的代码
  • ¥15 这种微信登录授权 谁可以做啊
  • ¥15 请问我该如何添加自己的数据去运行蚁群算法代码
  • ¥20 用HslCommunication 连接欧姆龙 plc有时会连接失败。报异常为“未知错误”
  • ¥15 网络设备配置与管理这个该怎么弄
  • ¥20 机器学习能否像多层线性模型一样处理嵌套数据
  • ¥20 西门子S7-Graph,S7-300,梯形图
  • ¥50 用易语言http 访问不了网页