关于HDFS中的NameNode和Secondary NameNode一个细节问题

关于HDFS中的NameNode和Secondary NameNode有个问题：
假如当前计算机需要4条edit记录去描述一个完整的文件变动行为，这意味着edit.inprogress需要跨4个单位即edit0000012-edit0000015才是一条完整的edit，如果edit.inprogress当前正在已追加两条，检查点机制开启（达到特定时间），
NameNode会新创建一个edit.inprogress存放新的edit，那么在之前inprogress中已书写完毕的两条数据会和还未书写的两条数据一并被拷贝到新的inprogress中吗？还是与fsimage一起被拷贝到SNN中合并呢？亦或者是client对文件的更改本身是一个原子操作，系统会判定当前对文件的更改操作有没有结束再决定要不要开启检查点操作？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2023-08-25 16:40
关注
引用皆我百晓生小程序回复内容作答：

当NameNode开启检查点机制时，它会将当前正在被编辑的edit.log文件（即edit.inprogress）以及当前的fsimage文件一起进行备份。这样做的目的是为了确保在发生故障时，可以使用这些备份文件来进行恢复。

在你描述的场景中，假设edit.inprogress文件已经写入了两条记录，当NameNode触发检查点机制时，它会创建一个新的edit.inprogress文件来存放新的edit记录。已经写入的两条数据不会被复制到新的edit.inprogress文件中，而是会与当前的fsimage文件一起备份到Secondary NameNode（SNN）中。

因此，NameNode会将新的edit记录和已经写入的两条记录分别存放在两个不同的edit.inprogress文件中，并将它们与当前的fsimage文件一起传输给SNN进行合并。这样做的目的是确保数据的一致性和完整性，并保留对故障进行恢复的能力。

值得注意的是，这里的检查点操作并不是由客户端的文件更改触发的，而是由NameNode自主地定期触发或在达到特定条件（例如特定时间间隔）时触发。因此，客户端对文件的更改并不会直接影响检查点操作的进行。检查点操作的目的是为了确保元数据的一致性，并提供灾难恢复的能力。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【大数据之Hadoop】六、HDFS之NameNode、Secondary NameNode和DataNode的内部工作原理
2023-03-29 17:45

阿宁呀的博客（3）NameNode记录操作日志，更新滚动日志。（先记录日志再更改内存，如果先更改内存再记录，在更改内存后遇到断电，则不会记录此次...（3）DataNode每隔一个周期（6h）向NameNode汇报所有块的信息，保证数据的可靠性。
Hadoop 教程 - HDFS之NameNode和SecondaryNameNode
2024-06-24 16:00

用心去追梦的博客在Hadoop Distributed File System (HDFS)中，NameNode和Secondary NameNode是两个关键组件，它们共同协作以维护文件系统的元数据和确保数据的可靠性。
HDFS 中 NameNode、DataNode 和 SecondaryNameNode 的工作机制
2024-04-29 18:19

文刀小桂的博客【代码】HDFS 中 NameNode、DataNode 和 SecondaryNameNode 的工作机制。
HDFS中NameNode、Secondary NameNode介绍及工作机制详细教程
2020-04-28 10:06

lmh450201598的博客 HDFS集群包括，NameNode和...DataNode 负责管理用户的文件数据块，每一个数据块都可以在多个datanode上存储多个副本，Secondary NameNode用来监控HDFS状态的辅助后台程序，每隔一段时间获取HDFS元数据的快照。一、N...
HDFS中NameNode和SecondaryNameNode工作机制详解
2020-02-03 15:52

火成哥哥的博客一、为何要引入SecondaryName？思考：NameNode中的元数据是储存在哪里的？首先，我们做个假设，如果存储在NameNode节点的磁盘中，因为经常需要进行随机访问，还有...
HDFS中NameNode和Secondary NameNode
2020-11-29 19:55

乱炖-l的博客这样会带来一个问题，如果掉电，内存中的数据就没有了，所以为了保证元数据的安全性，所以需要对内存中的元数据进行备份。所以磁盘中就产生了备份数据FsImage。但是这样还是会出现另一个问题，那就是当我们更新了...
HDFS中，NameNode，DataNode及SecondaryNameNode的作用(大数据面试高频二)
2022-10-05 16:15

东南枝上的大雄的博客 HDFS中，NameNode，DataNode及SecondaryNameNode的作用
HDFS Secondary NameNode深度解析：工作机制与在高可用中的真实角色
2026-02-28 21:48

Seal^_^的博客工作机制：定期从NameNode拉取FsImage和EditLog，在内存中合并生成新的FsImage，返回给NameNode触发条件：时间间隔（默认1小时）或事务数（默认100万条）核心目标：缩短NameNode启动时间，防止EditLog无限增长。
HDFS 核心组件详解：NameNode、DataNode 与 Secondary NameNode 原理解析
2025-05-12 20:28

Kiss1024b的博客 HDFS 是 Hadoop 生态系统中专为海量数据存储而设计的分布式文件系统，其核心由 NameNode、DataNode 和 Secondary NameNode 三个组件构成。本文详细解析这三大组件的功能职责、运行机制及其在数据存储、容错和元数据...
HDFS中NameNode、DataNode、Secondary NameNode的作用
2019-11-03 11:19

敲代码的卡普罗尼的博客这些信息在NameNode中保存在两个文件中，分别是FSImage（命名空间镜像）和EditLog（编辑日志）（2）名字节点中保存着数据块与数据节点的对应关系。因此，当我们要读写数据时，首先联系名字节点获取数据所在的Dat...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月24日

关于HDFS中的NameNode和Secondary NameNode一个细节问题

1条回答 默认 最新

问题事件

1条回答默认最新