Tsai时越 2023-01-18 11:00 采纳率: 50%
浏览 30

python分布式爬虫

分布式爬虫实现方案,需要使用哪些框架,用rabbitmq还是kafka处理

  • 写回答

3条回答 默认 最新

  • 「已注销」 2023-01-18 11:05
    关注

    在实现 Python 分布式爬虫时,可以使用一些常用的框架来帮助你实现这个任务。

    Scrapy: 一个用于提取网页数据的 Python 框架,可以实现爬虫的核心功能。

    Celery: 一个 Python 分布式任务队列,可以用来实现爬虫的分布式调度。

    Redis: 一个开源的键值存储数据库,可以用来存储爬虫的任务队列和结果。

    RabbitMQ 或 Kafka:两种消息队列系统,可以用来在爬虫的不同节点之间进行.

    评论

报告相同问题?

问题事件

  • 创建了问题 1月18日