MariaDB Galera集群重启问题

操作：
我使用Docker部署了一个MariaDB Galera的集群（三台服务器），Docker run部分使用了下列环境变量：

    -e MARIADB_DATABASE=testdb \
    -e MARIADB_MASTER_HOST=192.168.1.1 \
    -e DB_MASTER_HOST=192.168.1.1 \
    -e NODE_NAME=mariadb-node1 \
    -e MARIADB_GALERA_NODE_NAME=mariadb1 \
    -e MARIADB_GALERA_NODE_ADDRESS=192.168.1.1  \
    -e MARIADB_GALERA_CLUSTER_ADDRESS="gcomm://192.168.1.1:4567,192.168.1.2:4567,192.168.1.3:4567" \
    -e MARIADB_GALERA_CLUSTER_NAME=mariadb-clust \
    -e MARIADB_ROOT_PASSWORD=root111 \
    -e GALERA=ON \
    -e MARIADB_GALERA_CLUSTER_BOOTSTRAP=yes \
    -e MARIADB_GALERA_FORCE_SAFETOBOOTSTRAP=yes \
    -e MARIADB_GALERA_MARIABACKUP_USER=backup \
    -e MARIADB_GALERA_MARIABACKUP_PASSWORD=root111 \
    -e MARIADB_USER=user \
    -e MARIADB_PASSWORD=root111 \
    -e MARIADB_REPLICATION_USER=repl \
    -e MARIADB_REPLICATION_PASSWORD=root111 \
    -e MARIADB_SERVER_ID=101\
    -e TIMEZONE=Asia/Shanghai \

第一个节点使用了上面的全部环境变量【第一个节点是引导节点】，第二个和第三个节点除了NAME和ADDRESS，还有SERVER_ID这些必须唯一的配置修改外，还去掉了MARIADB_GALERA_CLUSTER_BOOTSTRAP和MARIADB_GALERA_FORCE_SAFETOBOOTSTRAP这两个变量。

现象：

部署后三个节点如果一直运行，则MariaDB访问正常，数据也会正确同步。
如果第二个节点或第三个节点断掉，重启后数据同步正常。
如果第一个节点断掉，则二三节点的数据不会再往第一个节点同步（好像第一个节点从集群中脱离）。
出现3这个问题后，通过查找发现第一个节点的wsrep_cluster_address为“gcomm://”，通过查资料发现，是因为环境变量MARIADB_GALERA_CLUSTER_BOOTSTRAP=yes 引起的（虽然对MARIADB_GALERA_CLUSTER_ADDRESS有赋值，但是MARIADB_GALERA_CLUSTER_BOOTSTRAP=yes 会自动将wsrep_cluster_address为“gcomm://”）。wsrep_cluster_address为“gcomm://”，从而导致第一个节点重新引导创建了一个集群，和原来的集群脱离。于是重新使用docker run运行容器，同时将环境变量MARIADB_GALERA_CLUSTER_BOOTSTRAP=yes 的这个设置去掉。去掉后发现wsrep_cluster_address的值正常了，且第二、三节点的数据也同步到第一个节点了。
按4中的方式修改第一个节点后，又遇到新问题：当三个节点同时断掉后，重启三个节点，然后三个节点的MariaDB都起不来了。查看docker日志发现“This node was previouly booted, you may need to force bootstrapping in one of the nodes.”。缺少引导，三个节点都起不来了。（但是第一个节点设置的有MARIADB_GALERA_FORCE_SAFETOBOOTSTRAP=yes，不明白为啥无效）
除了上述现象外，还发现，部署后，通过“SHOW VARIABLES ”查到的三个节点的server_id都是1（通过MARIADB_SERVER_ID设置的无效）。

预期：

三个节点不管哪个节点断掉，重启后，都可以正常同步。
三个节点都断掉，重启后，三个节点可以正常使用，数据同步。
部署后三个节点的server_id能根据设置，变成唯一的（正常的话，三个节点的server_id不应重复）

帮忙看看，如何调整可以实现预期，谢谢！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
越重天新星创作者: Java技术领域 2024-09-11 16:04
关注
根据你提供的信息，以下是一些可能的调整建议来实现你的预期：

确保所有节点的防火墙已正确配置，允许 MariaDB 的通信端口通过。
检查 Galera 集群配置文件中的参数设置是否正确，特别是集群节点的 IP 地址、端口号、节点名称等。
确认使用的 Galera 插件版本与 MariaDB 10.1 版本兼容。
对于 server_id 问题，检查配置文件中是否正确设置了每个节点的 server_id。
考虑调整 Galera 相关参数，如 gcache.size、gcs.fc_limit、gcs.fc_factor 和 gcs.fc_window_size，以优化内存使用和复制效率。
在进行大数据导入操作时，确保集群有足够的内存资源，并采用优化的导入策略，如分批次导入、避免高峰期操作等。
监控集群内存使用情况、复制流量、FC 状态等关键指标，及时发现并解决问题。
定期清理不再需要的 write-sets，释放被占用的内存。
考虑增加节点的物理内存或横向扩展集群节点数量，以提升处理 write-sets 的能力。
检查是否存在网络问题或其他硬件故障，确保节点之间的通信正常。

请注意，具体的调整方法可能因你的实际环境和需求而有所不同。在进行任何更改之前，建议备份重要的数据，并仔细评估每个调整的潜在影响。如果问题仍然存在，建议进一步查阅相关文档或寻求专业的技术支持。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

CentOS 7安装MySQL集群-GALERA CLUSTER 4 FOR MYSQL 8 RELEASE
2021-03-28 10:50

搬山境KL攻城狮的博客文章目录一、前言二、准备三、安装四、基础配置1.关闭selinux2.关闭防火墙3.禁用服务4.启用服务5.系统调优6.hosts及主机名（node1、node2）五、配置1./etc/my.cnf配置2.初始化node13....Galera Cluster需要
MariaDB面试题及参考答案
2024-11-22 00:06

大模型大数据攻城狮的博客什么是 MariaDB？ MariaDB 是一个开源的关系型数据库管理系统，它是 MySQL 数据库的一个分支。它的主要目的是存储和管理数据，采用了关系模型，数据存储在表中，表之间可以通过关联建立关系。从起源来讲，...
Linux高级篇--MySQL高可用集群
2019-04-03 10:19

天空飘过的鱼的博客 MySQL集群 MySQL高可用 MMM: Multi-Master Replication Manager for MySQL，Mysql主主复制管理器是一套灵活的脚本程序，基于perl实现，用来对mysql replication进行监控和故障迁移，并能管理mysql Master-Master...
MySQL大数据高可用分片式集群方案选型
2018-04-12 14:00

Alex许恒的博客目前基于Galera Cluster的实现方案有三种：Galera Cluster for MySQL、Percona XtraDB Cluster、MariaDB Galera Cluster。我们采用较成熟、应用案例较多的Percona XtraDB Cluster。应用案例：超过2000多家外国...
docker搭建MySQL集群
2021-03-30 20:32

袖手天下-的博客一、读写分离架构其中一个是主库，负责写入数据，称之为：写库；其它都是从库，负责读取数据，称之为...在中间件中进行区分读写操作，读发送到从节点，写发送到主节点该架构也存在问题，中间件的性能成为了系统的瓶
从Galera到PXC：一文搞懂MySQL多主同步复制的演进史
2025-10-10 09:09

stem5的博客本文深入解析了MySQL多主同步复制从Galera到...文章对比了传统异步复制的局限，重点阐述了PXC集群基于Galera库实现强一致性的核心原理，并探讨了其企业级应用实践与架构选型考量，为构建高可用数据库架构提供关键参考。
Mysql数据库平滑扩容解决高并发和大数据量问题
2022-05-23 10:46

赵广陆的博客目录1 停机方案2 停写方案3 平滑扩容之双写方案（中小型数据）4 平滑扩容之2N方案大数据量问题解决4.1 扩容问题4.2 解决方案4.3 双主架构思想4.4 环境部署4.4.1 MariaDB服务安装4.4.2 MariaDB双主同步4.4.3 ...
MySQL集群干货
2019-12-07 17:34

stevenux的博客 MySQL集群一.MySQL 主从复制1.1 主从复制概念1.1.1 主从复制原理1.1.2 二进制日志类型1.1.3 主从复制所涉及的线程1.2 主从复制涉及的变量1.2.1 Master1.2.2 Slave1.2.3 Best Practices1.3 监控和管理复制1.4 检查...
大数据视角下的数据库集群脑裂问题与解决方案
2025-05-16 13:19

全栖数字主理人的博客数据库集群脑裂（Split-Brain）是分布式系统中因网络分区或节点故障导致集群分裂为多个独立子集群的现象，可能引发数据不一致和系统不可用。核心原因包括网络分区、选举机制缺陷和负载不均。大数据场景下，脑裂会...
PXC 集群搭建
2019-04-09 15:47

wjq008的博客 wsrep_provider=/usr/lib64/galera3/libgalera_smm.so wsrep_cluster_name=pxc-cluster #PXC集群的名称 wsrep_cluster_address=gcomm://192.168.99.151,192.168.99.159,192.168.99.215 wsrep_node...
mysql_mariadb实用常用命令集等2018_LCF
2018-05-27 21:50

璐程风的博客 mysql 和mariadb都是同一作者开发的，所以很多命令基本相通，以及其它数据库，命令很多基本相似。下面是自己整理出来的常用和实用的命令，希望能对大家有所帮助。一、查看篇1) 查看当前数据库版本信息MariaDB [(none...
MySQL数据库集群——PXC
2018-12-03 23:34

凡尘code的博客 MySQL数据库集群业务处理向集群中导入千万级数据 大数据分页优化高并发引起的重复写入冷热数据分离，海量数据归档全量备份与增量备份数据误删除的恢复 ...
MySQL数据库（九）集群 Cluster 和性能优化
2020-07-05 11:59

特洛伊CAR的博客文章目录6 MySQL 集群 Cluster6.1 MySQL主从复制6.1.1 主从复制架构和原理6.1.2 实现主从复制配置6.1.3 主从复制相关6.1.4 实现级联复制6.1.5 主主复制6.1.6 半同步复制6.1.7 复制过滤器6.1.8 主从复制加密6.1.9 ...
MySQL数据库集群-PXC方案-脚本
2022-11-27 23:16

兜兜转转@的博客 MySQL数据库集群-PXC方案-脚本
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 9月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月11日

MariaDB Galera集群重启问题

1条回答 默认 最新

问题事件

1条回答默认最新