HDFS的流水线复制策略一个DataNode存多大数据？

在分布式文件系统HDFS的数据复制流水线策略中，有描述说NameNode返回一个DataNode列表给客户端，客户端开始向第一个DataNode写数据，然后“当数据节点接收到4KB的数据后就写入本地并把4KB数据和列表传给第二个数据节点”，这里4KB什么意思啊？是设置的默认值吗，为什么一个数据节点只存4KB的数据，文件块的大小不是默认64M或者128M吗？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
陈猿解码 2021-11-26 08:28
关注
这是哪里看到的4KB?
HDFS的数据传输是以packet为单位进行传输的，每个packet里面又由多个chunk组成，chunk大小默认为512字节，而packet大小应该是64KB
详细可参考（https://blog.csdn.net/hncscwc/article/details/119467272
另外，写流程可参考（https://blog.csdn.net/hncscwc/article/details/119467272

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

hadoop hdfs dfs没有任何反应？ hadoop hdfs 大数据
2022-10-04 19:13

回答 1 已采纳不是没有反应，而是目录下没有文件，所以ls后没有内容可以显示，可以试试ls /
HDFS集群数据迁移怎么做？ hdfs 大数据
2022-11-03 17:15

回答 2 已采纳 hadoop distcp webhdfs://源集群:50070/源目录 webhdfs://目标集群:50070/目标目录
Hadoop的配置文件datanode需要改吗？ hadoop
2022-08-13 22:09

回答 1 已采纳主要还是看配置的端口有没有被占用，有的话就需要改
大数据｜HDFS分布式文件系统
2023-03-07 23:43

啦啦右一的博客 大数据｜HDFS分布式文件系统
hdfs里的 ?edits和 ?fsimage作用？大数据
2022-10-31 11:30

回答 2 已采纳请看👉 ：HDFS的fsimage和edits是什么、有什么作用除此之外, 这篇博客: HDFS面试题中的 10、HDFS里面的edits和fsimage作用？部分也许能够解决你的问题, 你可以仔
hdfs副本只有一个虚拟机，还有两个虚拟机里没有 hadoop hdfs 有问必答
2021-12-20 14:54

回答 5 已采纳看您core-site.xml和hdfs.xml配置文件里面的配置，感觉配置的有点少哦，hdfs-site.xml中至少需要指明的是dfs.namenode.name.dirdfs.datanode.
有200M的文件 ?写入HDFS是先写128M ?复制完之后再写72M ?还是全部写完再复制？大数据
2022-10-24 11:26

回答 1 已采纳 HDFS上在写入数据的时候，首先会对数据切块，然后从客户端到datanode形成一个管道，在至少将一个文件写入hdfs上后，表示文件写入成功，然后进行复制备份操作，所以是全部写完再复制。学习可关注：人
大数据-hdfs-DataNode功能-小记
2019-11-05 21:07

进阶的橙汁糖的博客每一个block都可以在多个DataNode上。 DataNode需要定时想namenode汇报自己持有的block信息。存储多个副本（副本数量也可以通过参数设置dfs.replication，默认是3） 1.向NameNode节点报告状态，每个DataNode节点会...
[HDFS]hive表文件下的.metadata文件夹是什么？ hdfs hive java sqoop 大数据
2018-06-13 06:26

回答 1 已采纳 metadata就是元数据，用来存放表结构、字段信息之类的，用来描述数据的数据。另外eclipse也有自己的metadata，你要看看是哪个metadata缺失了。
直接将hbase数据存磁盘和存hdfs的区别是什么？ hbase
2021-07-08 10:38

回答 2 已采纳 hdfs和磁盘的区别在于 hdfs从设计上存在分布式高可用可控副本数，Block块等特别，磁盘目前还无法满足，且生态上目前都是兼容hdfs而不是磁盘。存储的设计底层还是数据结构不一样，可以从这方向思
java使用Kerberos一段时间后过期了，怎么办？ hadoop hdfs java 大数据
2018-05-03 02:34

回答 3 已采纳票据有过期时间的设置crontab 定期去刷新就好了。或者你把过期时间设置很大
大数据入门：HDFS数据副本存放策略
2020-12-01 17:48

加米谷大数据张老师的博客 大数据处理当中，数据储存始终是一个重要的环节，从现阶段的市场现状来说，以Hadoop为首的大数据技术框架，仍然占据主流地位，而Hadoop的HDFS，在数据存储方面，仍然得到重用。今天的大数据入门分享，我们就来讲讲...
大数据用的nosql与传统型数据库的比较？ java 向大咖问开源
2021-04-03 00:10

回答 2 已采纳 nosql和sql并不是一个对立的概念。 大数据其实不光使用nosql的数据库，也使用传统关系型数据库。 hbase和mysql最终要的一个差别就是存储上hbase是按列存储，mysql是按行存储
大数据笔记（二）：HDFS原理知识
2022-04-22 13:44

Lansonli的博客存储模型架构设计角色功能元数据持久化安全模式副本放置策略读写流程
大数据管理与分析第三章 HDFS
2022-06-23 16:35

黄昏贩卖机的博客 HDFS 是不能直接访问各个datanode 的Linux文件系统的当客户端要在HDFS上写一个文件：文件复制功能：HDFS 默认有3个副本硬件和操作系统的异构性：HDFS由JAVA实现，可以在不同操作系统和计算机上实现相同的客户端和...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月21日

悬赏问题

¥15 关于#java#的问题，请各位专家解答！
¥15 急matlab编程仿真二阶震荡系统
¥20 TEC-9的数据通路实验
¥15 ue5 .3之前好好的现在只要是激活关卡就会崩溃
¥50 MATLAB实现圆柱体容器内球形颗粒堆积
¥15 python如何将动态的多个子列表，拼接后进行集合的交集
¥20 vitis-ai量化基于pytorch框架下的yolov5模型
¥15 如何实现H5在QQ平台上的二次分享卡片效果？
¥30 求解达问题（有红包）
¥15 请解包一个pak文件

HDFS的流水线复制策略一个DataNode存多大数据？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新