docker 部署 hadoop-HA 报错

集群：三台 zookeeper，三台hadoop

报错内容：

24/05/03 09:11:27 ERROR namenode.NameNode: Error encountered requiring NN shutdown. Shutting down immediately.
java.lang.IllegalArgumentException: Expected exactly 2 NameNodes in namespace 'mycluster'. Instead, got only 3 (NN ids were 'nn1','nn2','nn3'
        at com.google.common.base.Preconditions.checkArgument(Preconditions.java:115)
        at org.apache.hadoop.hdfs.HAUtil.getNameNodeIdOfOtherNode(HAUtil.java:168)
        at org.apache.hadoop.hdfs.HAUtil.getConfForOtherNode(HAUtil.java:195)
        at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer.getActiveNodeAddress(EditLogTailer.java:134)
        at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer.<init>(EditLogTailer.java:115)
        at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.startStandbyServices(FSNamesystem.java:1316)
        at org.apache.hadoop.hdfs.server.namenode.NameNode$NameNodeHAContext.startStandbyServices(NameNode.java:1861)
        at org.apache.hadoop.hdfs.server.namenode.ha.StandbyState.enterState(StandbyState.java:58)
        at org.apache.hadoop.hdfs.server.namenode.NameNode.<init>(NameNode.java:909)
        at org.apache.hadoop.hdfs.server.namenode.NameNode.<init>(NameNode.java:884)
        at org.apache.hadoop.hdfs.server.namenode.NameNode.createNameNode(NameNode.java:1610)
        at org.apache.hadoop.hdfs.server.namenode.NameNode.main(NameNode.java:1678)

zookeeper集群正常运行，hadoop配置文件如下：
core-site.xml

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://mycluster</value>
    </property>
    <property>
        <name>ha.zookeeper.quorum</name>
        <value>zookeeper1:2181,zookeeper2:2181,zookeeper3:2181</value>
    </property>
</configuration>

hdfs-site.xml

<configuration>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file://${hadoop.tmp.dir}/namenode</value>
        <description>NameNode directory for namespace and transaction logs storage.</description>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file://${hadoop.tmp.dir}/datanode</value>
        <description>DataNode directory</description>
    </property>
    <property>
        <name>dfs.replication</name>
        <value>2</value>
    </property>
    <property>
        <name>dfs.journalnode.edits.dir</name>
        <value>${hadoop.tmp.dir}/jn</value>
    </property>

    <property>
        <name>dfs.nameservices</name>
        <value>mycluster</value>
    </property>
    <property>
        <name>dfs.ha.namenodes.mycluster</name>
        <value>nn1,nn2,nn3</value>
    </property>
    <property>
        <name>dfs.namenode.rpc-address.mycluster.nn1</name>
        <value>master1:8020</value>
    </property>
    <property>
        <name>dfs.namenode.rpc-address.mycluster.nn2</name>
        <value>master2:8020</value>
    </property>
    <property>
        <name>dfs.namenode.rpc-address.mycluster.nn3</name>
        <value>master3:8020</value>
    </property>
    <property>
        <name>dfs.namenode.http-address.mycluster.nn1</name>
        <value>master1:50070</value>
    </property>
    <property>
        <name>dfs.namenode.http-address.mycluster.nn2</name>
        <value>master2:50070</value>
    </property>
    <property>
        <name>dfs.namenode.http-address.mycluster.nn3</name>
        <value>master3:50070</value>
    </property>
    <property>
        <name>dfs.namenode.shared.edits.dir</name>
        <value>qjournal://master1:8485;master2:8485;master3:8485/mycluster</value>
    </property>

    <property>
        <name>dfs.ha.fencing.methods</name>
        <value>sshfence</value>
    </property>

    <property>
        <name>dfs.client.failover.proxy.provider.mycluster</name>
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
    </property>

    <property>
        <name>dfs.ha.automatic-failover.enabled</name>
        <value>true</value>
    </property>
</configuration>

配置的是三台，配置文件也看了好几遍，按照他的要求删掉了一个nn3后可以了，但是为什么三个namenode就不行呢？
nn1格式化namenode的时候是成功的，说明他连接到另外两台了吧

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-05-03 17:37
关注
引自免费微信小程序：皆我百晓生

看起来您在尝试配置一个三节点的Hadoop High Availability（HA）环境，但遇到了错误，错误信息指出期望有恰好两个NameNodes，但实际上检测到了三个。根据您的配置，您试图配置一个名为mycluster的nameservice，并且已经为每个NameNode nn1、nn2 和 nn3 分配了相应的RPC和HTTP地址。

要解决这个问题，首先我们需要理解HDFS HA设计。在HDFS HA中，通常情况下，我们有一个活动NameNode和一个热备NameNode。这意味着在任何时候，只有两个NameNode实例在工作——一个主NameNode（Active），负责处理所有客户端请求，另一个是从NameNode（Standby），准备在主NameNode失败时接管。因此，配置文件中的dfs.ha.namenodes.mycluster属性应该只包含两个NameNode ID，而不是三个。

为了修复此问题，请按照以下步骤操作：

删除多余的NameNode配置：

在 hdfs-site.xml 文件中，找到并删除与nn3相关的所有配置，包括但不限于：
dfs.namenode.rpc-address.mycluster.nn3
dfs.namenode.http-address.mycluster.nn3
可能还有其他与nn3相关的配置，例如用于 fencing 的配置等。

重新启动HDFS服务：

停止所有Hadoop相关服务，包括HDFS和YARN。
确保ZooKeeper仍在运行。
重新启动NameNode和DataNode服务。

格式化活动NameNode：

如果之前没有格式化过，确保至少对一个NameNode进行格式化。这将创建共享日志目录的元数据。使用命令：
hdfs namenode -format -force -nonInteractive

注意，这个命令应该在其中一个NameNode上执行，比如nn1，并且在执行前确认其它NameNode未处于活动状态。

启动HDFS服务：

使用Hadoop的start-dfs.sh脚本启动整个HDFS集群。

验证配置：

您可以通过访问NameNode的Web界面（默认端口50070）来检查是否成功启动，并查看状态页以确认HA是否已启用以及当前的活动和待机NameNode。

完成上述步骤后，您的Hadoop HA集群应该会正确地运行在一个活跃的NameNode和一个备用NameNode之间切换。如果您仍然遇到问题，可能需要检查网络配置、防火墙设置或者SSH密钥对是否正确配置，以便在NameNode之间实现自动故障转移。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

运行docker-compose或者输入 docker-compose --version 报错。 docker
2023-04-12 08:08

回答 2 已采纳之前也是在网上找文章去安装docker-compose，只有一个能正常启动，#安装docker 安装yum-utils yum install -y yum-utils 配置yum源 yum-conf
docker部署jar项目一直报错到底是哪里的问题？ docker jar 容器
2022-09-06 16:23

回答 2 已采纳 1、你先试一下这个jar包，能否通过java -jar 去启动，先排除jar问题；2、如果jar没有问题，你发一下dockerfile文件内容，看内容是否有问题。
docker运行第一个hello-world镜像报错 docker
2019-06-12 16:56

回答 1 已采纳 setenforce 0
docker部署hadoop-ha集群配置(所有环境已经封装好了)
2022-07-11 18:27

玉江仙。的博客 docker搭建hadoop-HA高可用集群
docker-php-ext-install: command not found php
2019-04-30 22:59

回答 1 已采纳你没有安装docker的php扩展重新安装下php https://blog.csdn.net/qw_xingzhe/article/details/80179094
Docker部署pig-ui，容器启动一直处于restaring状态 docker java
2021-10-19 17:49

回答 1 已采纳 upstream pig-gateway 这条DNS解析不了，nginx配置问题
docker内启动tomcat报错 docker tomcat 容器
2022-08-09 10:43

回答 3 已采纳 1.建议重新下载，下载前先把旧的镜像remove掉
通过docker-compose安装hadoop
2023-12-20 18:13

爱吃橙子的成的博客如果不关闭V2版本的话，运行docker-compose命令时会报错：unexpected character “-” in variable name near，执行docker-compose disable-v2解决该问题。4）对于高可用集群，默认会启动两个NameNode，一个是Active...
docker build报错，dock build创建镜像报错 docker python 容器
2022-04-14 14:47

回答 2 已采纳解决了，进docker engine修改一下
springboot连接docker上的数据库，连接失败 docker java spring boot 有问必答
2022-01-17 14:05

回答 3 已采纳驱动包和数据库版本是否一致。
通过命令来启用 Hyper-V报错 docker windows
2022-08-31 10:27

回答 1 已采纳控制面板中开启hyper-V。
hadoop系列(二)HA高可用方式部署
2021-12-13 22:16

程序员劝退师丶的博客 hadoop系列(一)hadoop集群安装hadoop系列(二)HA高可用方式部署hadoop系列(三) HDFS的shell操作和常用API操作hadoop系列(四)HDFS的工作机制，MapReduce，yarn流程及核心原理hadoop系列(五)input和output主节点...
docker启动es后日志报错求解决方案蒙了 docker
2022-01-04 16:27

回答 1 已采纳你把执行命令啥的都列一下啊,,
大数据基础——Hadoop大数据平台搭建
2021-01-27 16:19

陈敬雷-充电了么-CEO兼CTO的博客文章目录前言Hadoop大数据平台搭建一．Hadoop原理和功能介绍二．Hadoop安装部署三．Hadoop常用操作总结此文章摘自充电了么创始人，CEO兼CTO陈敬雷先生的新书《分布式机器学习实战》（人工智能科学与技术丛书）。更...
Hadoop HA (三) --------- HDFS-HA 自动模式
2022-07-30 20:56

在森林中麋了鹿的博客 HDFS-HA 自动模式
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 5月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月3日

悬赏问题

¥15 mySQL5.7.34安装遇到的问题
¥15 结构功能耦合指标计算
¥20 visual studio中c语言用ODBC链接SQL SERVER
¥50 AI大模型精调（百度千帆、飞浆）
¥15 非科班怎么跑代码？如何导数据和调参
¥15 福州市的全人群死因监测点死亡原因报表
¥15 Altair EDEM中生成一个颗粒，并且各个方向没有初始速度
¥15 系统2008r2 装机配置推荐一下
¥15 悬赏Python-playwright部署在centos7上
¥15 psoc creator软件有没有人能远程安装啊

docker 部署 hadoop-HA 报错

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新