designerchen 2018-05-28 01:59 采纳率: 0%
浏览 3284
已结题

实时数据导入hdfs,怎么样缓解写入压力?

我现在的需求是用flume进行数据源监控和传输,kafka作为中间件作为写入压力缓冲,最后导入hdfs,为后面的大数据分析。刚才问了一个大神,他说kafka和hdfs之间用stream,想问问各位大神怎么设计缓解hdfs写入压力。

  • 写回答

5条回答 默认 最新

  • 默默悟问 2018-05-28 02:27
    关注

    flume可以直接接hdfs的,为什么要额外用kafka呢。参考下:
    https://www.cnblogs.com/cssdongl/p/6077311.html
    http://www.cnblogs.com/cnmenglang/p/6543927.html

    评论

报告相同问题?

悬赏问题

  • ¥15 python的qt5界面
  • ¥15 无线电能传输系统MATLAB仿真问题
  • ¥50 如何用脚本实现输入法的热键设置
  • ¥20 我想使用一些网络协议或者部分协议也行,主要想实现类似于traceroute的一定步长内的路由拓扑功能
  • ¥30 深度学习,前后端连接
  • ¥15 孟德尔随机化结果不一致
  • ¥15 apm2.8飞控罗盘bad health,加速度计校准失败
  • ¥15 求解O-S方程的特征值问题给出边界层布拉休斯平行流的中性曲线
  • ¥15 谁有desed数据集呀
  • ¥20 手写数字识别运行c仿真时,程序报错错误代码sim211-100