designerchen 2018-05-28 01:59 采纳率: 0%
浏览 3284
已结题

实时数据导入hdfs,怎么样缓解写入压力?

我现在的需求是用flume进行数据源监控和传输,kafka作为中间件作为写入压力缓冲,最后导入hdfs,为后面的大数据分析。刚才问了一个大神,他说kafka和hdfs之间用stream,想问问各位大神怎么设计缓解hdfs写入压力。

  • 写回答

5条回答 默认 最新

  • 默默悟问 2018-05-28 02:27
    关注

    flume可以直接接hdfs的,为什么要额外用kafka呢。参考下:
    https://www.cnblogs.com/cssdongl/p/6077311.html
    http://www.cnblogs.com/cnmenglang/p/6543927.html

    评论

报告相同问题?

悬赏问题

  • ¥30 这是哪个作者做的宝宝起名网站
  • ¥60 版本过低apk如何修改可以兼容新的安卓系统
  • ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
  • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
  • ¥50 有数据,怎么用matlab求全要素生产率
  • ¥15 TI的insta-spin例程
  • ¥15 完成下列问题完成下列问题
  • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!