StonezzzzzzZ 2021-05-14 10:52 采纳率: 0%
浏览 28

python爬虫Scrapy框架中分布设计从节点爬虫程序出现为题

爬虫程序:

redis_key = 'xinfang_detail'
    # rules = (
    #     Rule(LinkExtractor(allow=r'fang\.anjuke\.com\/loupan\/\d+\.html'), callback='parse_item', follow=True),
    # )
    def parse_item(self, response):
        print("*"*20 + "开始爬取" + response.url)
        item = XinfangItem()
        # 房区名
        item['title'] = response.xpath('//*[@id="container"]/div[1]/div[2]/div[1]/div/div/div[1]/h1/text()').extract_first()
        # 价格
        item['price'] = response.xpath('//*[@id="container"]/div[1]/div[2]/div[1]/dl/dd[1]/p/em/text()').extract_first()
        # 地址
        yield item

反馈:

2021-05-14 10:38:46 [scrapy.core.scraper] ERROR: Spider error processing <GET https://ly.fang.anjuke.com/loupan/448966.html> (referer: https://ly.fang.anjuke.com/loupan/437877.html)
Traceback (most recent call last):
  File "d:\desktop\anjuke1.0\venv\lib\site-packages\twisted\internet\defer.py", line 662, in _runCallbacks
    current.result = callback(current.result, *args, **kw)
  File "d:\desktop\anjuke1.0\venv\lib\site-packages\scrapy\spiders\crawl.py", line 105, in _callback
    rule = self._rules[response.meta['rule']]
IndexError: list index out of range
  • 写回答

3条回答 默认 最新

  • 江天暮雪丨 2021-05-14 11:03
    关注

    这个IndexError错误是列表索引超过列表长度了,但我在你的代码中没看到有列表访问。可以贴一下完整代码?

    评论

报告相同问题?

悬赏问题

  • ¥15 如何绘制动力学系统的相图
  • ¥15 对接wps接口实现获取元数据
  • ¥20 给自己本科IT专业毕业的妹m找个实习工作
  • ¥15 用友U8:向一个无法连接的网络尝试了一个套接字操作,如何解决?
  • ¥30 我的代码按理说完成了模型的搭建、训练、验证测试等工作(标签-网络|关键词-变化检测)
  • ¥50 mac mini外接显示器 画质字体模糊
  • ¥15 TLS1.2协议通信解密
  • ¥40 图书信息管理系统程序编写
  • ¥20 Qcustomplot缩小曲线形状问题
  • ¥15 企业资源规划ERP沙盘模拟