Mike - 广东佳少 2024-06-13 22:47 采纳率: 50%
浏览 21
已结题

Hbase启动失败,无法启动HMaster

Zookeeper+Hadoop+Spark+Flink+Kafka+Hbase+Hive 完全分布式高可用集群搭建(保姆级超详细含图文)

CSDN搜了不少指导了,都无法解决Hbase报错。被这个报错搞了两周了,请收下我的膝盖,一拜。
各位技术资深总监,麻烦请帮忙看下,这种报错怎么解决?

参考资料,如上链接。
一、当前服务器环境:
1、Linux环境:三台服务器:node1(主节点),node2(从节点),node3(从节点)
2、版本配置: **jdk 1.8.0_361 + Zookeeper-3.7.1 + Hadoop-3.3.4 + Hive-3.1.3 + Kafka-2.12-3.4.0 + Spark-3.2.4 **
3、Hbase安装版本: HBase-2.4.17

二、集群启动顺序:
1、以root用户权限,启动 zookeeper,正常运行;
2、命令 su - hadoop 切换 hadoop用户权限后,启动hadoop、hdfs、Yarn、Hive,正常运行;
3、切换 root用户权限,启动kafka, spark后,可以正常运行;
4、启动Hbase时,报错,无法进行。

三、zookeeper、hadoop、hbase配置文件
zookeeper、hadoop、hbase、kafka、spark的安装目录,如下图1

img

3.1 zookeeper配置文件 zoo.cfg ,如下图2:

img

3.2 hadoop配置文件 core-site.xml ,如下图3

img

3.3 hbase配置文件 hbase-site.xml , 如下图4

img

3.4 hbase 配置文件 hbase-env.sh,如下


export JAVA_HOME=/export/server/jdk
export HBASE_PID_DIR=/export/server/hbase/pids
export HBASE_MANAGES_ZK=false

四、hbase启动报错描述
4. 1 Hbase启动前,zookeeper、hadoop、hive、kafka、spark 都可以正常启动,如下图5

img

4.2 Hbase启动时,第1次报错,如下图6
1、我采取的解决方法,删除文件:/export/server/hadoop-3.3.4/share/hadoop/common/lib/slf4j-reload4j-1.7.36.jar
2、删除slf4j-reload4j-1.7.36.jar 文件后,这个错误不再报错,接着第2次报错。

img

_4.3 删除slf4j-reload4j-1.7.36.jar 文件,出现第2次报错,如下图7_
1、报错描述:start-hbase.sh执行后,可以正常启动Hbase,输入jps验证,node1节点(主节点)出现 HMaster、HRegionServer 进程;几秒后,HMaster进程就自动关闭了,如下图7

img

2、验证端口60010 、端口16010是否冲突,发现没有其他进程占用程度情况

img

3、查询日志记录
查询日志文件
/export/server/hbase/logs/hbase-root-master-node1.log
/export/server/hbase/logs/hbase-root-regionserver-node1.log
报错信息,如下图8

img

[root@node1 logs]# pwd
/export/server/hbase/logs
[root@node1 logs]# tail -f hbase-root-master-node1.log
2024-06-15 22:37:28,067 INFO  [master/node1:16000] zookeeper.ZooKeeper: Session: 0x10000046c4c0004 closed
2024-06-15 22:37:28,067 INFO  [master/node1:16000] regionserver.HRegionServer: Exiting; stopping=node1,16000,1718462243016; zookeeper connection closed.
2024-06-15 22:37:28,067 ERROR [main] master.HMasterCommandLine: Master exiting
java.lang.RuntimeException: HMaster Aborted
        at org.apache.hadoop.hbase.master.HMasterCommandLine.startMaster(HMasterCommandLine.java:254)
        at org.apache.hadoop.hbase.master.HMasterCommandLine.run(HMasterCommandLine.java:145)
        at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:76)
        at org.apache.hadoop.hbase.util.ServerCommandLine.doMain(ServerCommandLine.java:140)
        at org.apache.hadoop.hbase.master.HMaster.main(HMaster.java:2963)
2024-06-15 22:37:28,067 INFO  [main-EventThread] zookeeper.ClientCnxn: EventThread shut down for session: 0x10000046c4c0004

CSDN搜了不少指导了,都无法解决这个问题。各位资深技术总监,麻烦请帮忙看下,这种报错怎么解决?

  • 写回答

23条回答 默认 最新

  • 专家-皆知 2024-06-13 22:56
    关注
    获得0.20元问题酬金

    参考免费微信小程序:皆我百晓生 作答,经由专家-皆知整理回复,如问题解决,望采纳;如仍有疑问,请评论回复。

    根据你提供的信息和日志,无法直接确定问题的确切原因,但可以分析出以下可能的几点:

    首先,你的HBase配置中的ZooKeeper集群位置可能被误写,在XML文件中应确保<name>hbase.zookeeper.quorum</name>节点的值是正确的。正确的写法应该是一系列由逗号分隔的服务器地址。根据你的情况,这个值应该是 node1,node2,node3,你的错误可能在之前的手动删除下划线的时候改变了原来的内容格式,但内容依然使用上下分开的版本号导致字符串形式出错。应该确认修改为 hbase.zookeeper.quorum节点内容为:"node1,node2,node3" 。没有错误的逗号和下划线字符来影响代码。为了避免不必要的字符错误,请确保使用正确的XML格式。此外,请确保ZooKeeper集群的IP地址和端口配置正确无误。如果ZooKeeper配置不正确,HBase将无法与ZooKeeper集群通信,从而导致HMaster无法启动。因此请检查ZooKeeper的配置文件和日志以确定是否存在问题。确认Zookeeper可以正常启动并且正常工作在集群中。另外,请检查你的HBase日志文件中是否有更详细的错误信息,以便更准确地定位问题所在。这可以通过在终端中使用tail命令查看日志文件来实现。如果日志文件中有更详细的错误信息或异常堆栈跟踪信息,将有助于确定问题的根本原因。并且根据你的系统情况(是否是最新更新过或发生过其它问题)进行检查以确保操作系统环境符合要求且无其他错误问题。可以尝试按照上述思路一一排查解决问题,由于问题描述的具体问题相对复杂涉及到多方面的细节错误分析的过程也可能较为繁琐但解决问题的核心就在于查找具体问题出现的位置。如果你能提供更详细的错误日志和更详细的系统环境信息可能会有助于我更准确的找到问题的根源和给出具体的解决方案。针对你提供的现有信息可以尝试调整你的hbase-site.xml配置文件并检查ZooKeeper的配置和日志以尝试解决问题。如果问题依然存在可能需要进一步深入排查和分析。同时请注意在修改配置或运行程序时遵循官方文档的建议并避免误操作以确保系统的稳定性和安全性。希望这些建议能对你有所帮助解决问题如果还有其他问题或者需要进一步的帮助请随时提问并提供更多详细信息我会尽力协助你解决问题。至于你在另一个回答中所提到需要AI帮你绘制图像或生成代码的需求如果可以提供更多具体的描述我会尽力帮助你完成。

    评论

报告相同问题?

问题事件

  • 系统已结题 6月21日
  • 修改了问题 6月15日
  • 创建了问题 6月13日

悬赏问题

  • ¥15 前台多人编辑时怎么让每个人保存刷新都互不干扰
  • ¥20 如何用Python删除单元格内连续出现的重复词?
  • ¥15 WangEditor嵌入到geeker-admin中,回车没有办法换行
  • ¥30 stm32f103c8t6制作万能红外遥控器
  • ¥15 有人会fastcrud写前端页面吗
  • ¥15 如何解除Uniaccess管控
  • ¥15 微信小程序跳转关联公众号
  • ¥15 Java AES 算法 加密采用24位向量报错如何处理?
  • ¥15 使用X11可以找到托盘句柄,监控到窗口点击事件但是如何在监听的同时获取托盘中应用的上下文菜单句柄
  • ¥45 字符串操作——数组越界问题