爱江山--爱美人 2017-07-07 02:38 采纳率: 0%
浏览 1802

scrapy中怎样递归的处理新增的url

def parse(self, response):#response为抓取返回的网页内容
item = Mypro1Item()
item['urlname'] = response.xpath("/html/head/title/text()")

    urls = re.compile(r'[a-zA-Z]+://[^\s]*[.com|.cn]').findall(response)
    for url in urls:
        yield Request(url,callback=self.parse)
    print(item['urlname'])


        为什么实现不了递归处理。
  • 写回答

1条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-09-09 18:27
    关注
    不知道你这个问题是否已经解决, 如果还没有解决的话:

    如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
    评论

报告相同问题?

悬赏问题

  • ¥15 教务系统账号被盗号如何追溯设备
  • ¥20 delta降尺度方法,未来数据怎么降尺度
  • ¥15 c# 使用NPOI快速将datatable数据导入excel中指定sheet,要求快速高效
  • ¥15 再不同版本的系统上,TCP传输速度不一致
  • ¥15 高德地图点聚合中Marker的位置无法实时更新
  • ¥15 DIFY API Endpoint 问题。
  • ¥20 sub地址DHCP问题
  • ¥15 delta降尺度计算的一些细节,有偿
  • ¥15 Arduino红外遥控代码有问题
  • ¥15 数值计算离散正交多项式