”小王同学” 2021-10-29 18:39 采纳率: 0%
浏览 10

scrapy爬取网页信息时,没有递归显示,而是在第一条中全部显示了


 def start_requests(self):
        url='https://my.qidian.com/bookcase/'
        yield Request(url,cookies=self.cookie_dict)

    def parse(self, response, **kwargs):
        list_selection=response.xpath("//tbody/tr")
        for one in list_selection:
            title=one.xpath('//b/a[2]/text()').extract_first()
            type = one.xpath('//b/a[1]/text()').extract_first()
            update=one.xpath('td[3]/text()').extract_first()
            author=one.xpath('td[4]/a/text()').extract_first()

            item=QidianLoginItem()
            item['title']=title
            item['type']=type
            item['update']=update
            item['author']=author

            yield item

结果就是

img


这里就会发现一个问题,就是它的title,type都是一样的,当查看详细内容是发现:

img


他们的title,type在全部显示在一个title中,这是为什么,求大家帮忙讲解。

  • 写回答

1条回答 默认 最新

  • CSDN专家-Time 2021-10-30 10:31
    关注

    你是不是title和type取错值了。

    img

    评论

报告相同问题?

问题事件

  • 创建了问题 10月29日

悬赏问题

  • ¥15 Workbench中材料库无法更新,如何解决?
  • ¥20 如何推断此服务器配置
  • ¥15 关于github的项目怎么在pycharm上面运行
  • ¥15 内存地址视频流转RTMP
  • ¥100 有偿,谁有移远的EC200S固件和最新的Qflsh工具。
  • ¥15 有没有整苹果智能分拣线上图像数据
  • ¥20 有没有人会这个东西的
  • ¥15 cfx考虑调整“enforce system memory limit”参数的设置
  • ¥30 航迹分离,航迹增强,误差分析
  • ¥15 Chrome Manifest扩展引用Ajax-hook库拦截请求失败