weixin_44157032 2022-10-19 14:43 采纳率: 68.8%
浏览 19
已结题

scrapy 怎么爬取网页中标签栏下的所有标签?

img

img

比如说我想爬取这4个标签(这只是我要爬取的其中一个网页)

这是我的部分代码:
spider.py

def parse(self, response:HtmlResponse, **kwargs):
    sel = Selector(response)
    list_tags = sel.css('#tags > li')
    img_item = ProjectItem()
    img_item['image_path'] = sel.css('img#wallpaper::attr(src)').extract()[0]
    for tag in list_tags:
        img_item['tag'] = tag.css('.tagname::text').extract()[0]
    yield img_item

items.py

class ProjectItem(scrapy.Item):
    image_path = scrapy.Field()
    tag = scrapy.Field()

在终端输入 scrapy crawl wallhaven -o data.csv 之后,生成的csv文件每个image_path都只对应一个标签,并没有4个,请问该如何修改代码,能让这4个标签都显示在一行?

  • 写回答

1条回答 默认 最新

  • honestman_ 2022-10-19 15:16
    关注

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 10月25日
  • 已采纳回答 10月19日
  • 修改了问题 10月19日
  • 修改了问题 10月19日
  • 展开全部

悬赏问题

  • ¥15 微信会员卡等级和折扣规则
  • ¥15 微信公众平台自制会员卡可以通过收款码收款码收款进行自动积分吗
  • ¥15 随身WiFi网络灯亮但是没有网络,如何解决?
  • ¥15 gdf格式的脑电数据如何处理matlab
  • ¥20 重新写的代码替换了之后运行hbuliderx就这样了
  • ¥100 监控抖音用户作品更新可以微信公众号提醒
  • ¥15 UE5 如何可以不渲染HDRIBackdrop背景
  • ¥70 2048小游戏毕设项目
  • ¥20 mysql架构,按照姓名分表
  • ¥15 MATLAB实现区间[a,b]上的Gauss-Legendre积分