Tsai时越 2023-01-18 11:00 采纳率: 50%
浏览 29

python分布式爬虫

分布式爬虫实现方案,需要使用哪些框架,用rabbitmq还是kafka处理

  • 写回答

3条回答 默认 最新

  • 「已注销」 2023-01-18 11:05
    关注

    在实现 Python 分布式爬虫时,可以使用一些常用的框架来帮助你实现这个任务。

    Scrapy: 一个用于提取网页数据的 Python 框架,可以实现爬虫的核心功能。

    Celery: 一个 Python 分布式任务队列,可以用来实现爬虫的分布式调度。

    Redis: 一个开源的键值存储数据库,可以用来存储爬虫的任务队列和结果。

    RabbitMQ 或 Kafka:两种消息队列系统,可以用来在爬虫的不同节点之间进行.

    评论

报告相同问题?

问题事件

  • 创建了问题 1月18日

悬赏问题

  • ¥20 我要一个分身加定位两个功能的安卓app
  • ¥15 基于FOC驱动器,如何实现卡丁车下坡无阻力的遛坡的效果
  • ¥15 IAR程序莫名变量多重定义
  • ¥15 (标签-UDP|关键词-client)
  • ¥15 关于库卡officelite无法与虚拟机通讯的问题
  • ¥15 目标检测项目无法读取视频
  • ¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
  • ¥100 求采集电商背景音乐的方法
  • ¥15 数学建模竞赛求指导帮助
  • ¥15 STM32控制MAX7219问题求解答