实时数据导入hdfs，怎么样缓解写入压力？

我现在的需求是用flume进行数据源监控和传输，kafka作为中间件作为写入压力缓冲，最后导入hdfs，为后面的大数据分析。刚才问了一个大神，他说kafka和hdfs之间用stream，想问问各位大神怎么设计缓解hdfs写入压力。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
默默悟问 2018-05-28 02:27
关注
flume可以直接接hdfs的，为什么要额外用kafka呢。参考下：
https://www.cnblogs.com/cssdongl/p/6077311.html
http://www.cnblogs.com/cnmenglang/p/6543927.html

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

大数据NiFi（十八）：离线同步MySQL数据到HDFS
2023-02-13 10:17

Lansonli的博客案例：使用NiFi将MySQL中数据导入到HDFS中。以上案例用到的处理器有“QueryDatabaseTable”、“ConvertAvroToJSON”、“SplitJson”、“PutHDFS”四个处理器。
FlinkCDC-Hudi数据实时入湖原理篇
2025-06-16 22:03

涤生大数据的博客面对海量数据开发场景，一种支持存储多种原始数据格式、多种计算引擎、高效的元数据统一管理的存储方式能极大的提高开发效率。
亿级数据如何分钟级别写入缓存？
2022-06-27 20:23

诸葛子房_的博客 1.背景在做用户画像的过程中经常会遇到，需要将用户数据入缓存的需求，提供给线上服务进行调用，因为最终加工的画像数据普遍会存储在离线表(Hive)或者一些其他存储中(HDFS、Doris 等等)但是这类数据存储的特点非常...
大数据存储域——HDFS存储系统
2025-08-06 21:49

庄小焱的博客 HDFS由Client、NameNode、SecondaryNameNode、DataNode等组件构成，通过特定的工作机制实现文件的读取和写入。它适用于多种场景，如日志采集、大数据离线分析等，但也有不适用的场景。文中还展示了如何在SpringBoot...
Sqoop把mysql数据导入hive，hdfs采用parquet+snappy存储
2020-12-03 15:36

Rudolf__的博客 1.业务和业务数据量不断增加，需要用到hadoop进行数据分析和存储，现在将mysql数据到到hive，每个mysql表结构都差不多，现在以order_node为例，它的字段类型有bigint,varchar,int,tinyint(1),tinyint(4),datetime,...
Hadoop总结——HDFS
2022-11-22 17:23

蓦然_的博客 Hadoop总结——HDFS
hdfs 数据迁移_Hadoop集群跨数据中心迁移实践
2020-11-28 00:35

晨曦姜的博客利用hdfs oiv命令转换fsimage checkpoint为结构化文本数据并导入hive，再用spark sql join把缺失的文件目录筛选出来，简单过滤加工之后生成文件列表，交由数据同步工具。</span></p>...
深入解析 Apache Doris 写入原理：一条数据的“落地之旅”
2025-09-17 00:13

数据极客圈的博客在日常的数据分析场景中，我们经常会向 Apache Doris 写入大量数据，无论是实时导入、批量导入，还是通过流式写入。但你是否想过：一条数据从客户端发出，到最终稳定落盘，中间到底经历了哪些步骤？
DataX使用、同步HDFS数据到MySQL案例、DataX优化
2022-12-10 08:00

Redamancy_06的博客当提升DataX Job内Channel并发数时，内存的占用会显著增加，因为DataX作为数据交换通道，在内存中会缓存较多的数据。例如Channel中会有一个Buffer，作为临时的数据交换的缓冲区，而在部分Reader和Writer的中，也会...
datax 导入数据中文乱码_DataX在有赞大数据平台的实践
2021-01-01 13:08

weixin_39550379的博客一、需求有赞大数据技术应用的早期，我们使用 Sqoop 作为数据同步工具，满足了 MySQL 与 Hive 之间数据同步的日常开发需求。随着公司业务发展，数据同步的场景越来越多，主要是 MySQL、Hive 与文本文件之间的数据...
没有解决我的问题, 去提问

实时数据导入hdfs，怎么样缓解写入压力？

5条回答 默认 最新

5条回答默认最新