konv1984 2017-03-14 03:21 采纳率: 100%
浏览 902
已结题

请教爬虫大虾,采用何种python爬虫架构?

现在的项目需要一个爬虫,爬取论文内容,只有中文论文,基本都是文字内容。另外后期会增加多个网站。前期要一次性爬取现有几千万篇,同时每天更新几万篇左右。整个爬虫采用何种框架,以及为什么采用这种框架,有何优缺点?需不需要分布式?

  • 写回答

1条回答 默认 最新

  • shen_wei 2017-03-14 03:35
    关注
    评论

报告相同问题?

悬赏问题

  • ¥15 求差集那个函数有问题,有无佬可以解决
  • ¥15 【提问】基于Invest的水源涵养
  • ¥20 微信网友居然可以通过vx号找到我绑的手机号
  • ¥15 寻一个支付宝扫码远程授权登录的软件助手app
  • ¥15 解riccati方程组
  • ¥15 display:none;样式在嵌套结构中的已设置了display样式的元素上不起作用?
  • ¥15 使用rabbitMQ 消息队列作为url源进行多线程爬取时,总有几个url没有处理的问题。
  • ¥15 Ubuntu在安装序列比对软件STAR时出现报错如何解决
  • ¥50 树莓派安卓APK系统签名
  • ¥65 汇编语言除法溢出问题