mysql+keepalived 切换后vip无法被备机接管，反之可以

今天一共搭建了6台3组两两互备的centos 6.5 mysql+keepalived的主主复制+双backup模式的集群。主机107的keepalived.conf如下：
! Configuration File for keepalived

global_defs {
notification_email {
acassen@firewall.loc
failover@firewall.loc
sysadmin@firewall.loc
}
notification_email_from Alexandre.Cassen@firewall.loc
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id mysql_ha
vrrp_skip_check_adv_addr
vrrp_strict
vrrp_garp_interval 0
vrrp_gna_interval 0
}

vrrp_instance VI_1 {
state BACKUP
interface eth0
virtual_router_id 117
priority 100
advert_int 1
nopreempt
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
10.40.6.117
}
}

virtual_server 10.40.6.117 3306 {
delay_loop 2
#lb_algo wrr
#lb_kind DR
persistence_timeout 60
protocol TCP

real_server 10.40.6.107 3306 {
    weight 3
    notify_down /usr/local/etc/keepalived/mysql.sh
    TCP_CHECK {
        connect_timeout 3
        nb_get_retry 3
        delay_before_retry 3
        connect_port 3306
    }
}

}
备机108的keepalived.conf如下：
! Configuration File for keepalived

vrrp_instance VI_1 {
state BACKUP
interface eth0
virtual_router_id 117
priority 90
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
10.40.6.117
}
}

virtual_server 10.40.6.117 3306 {
delay_loop 2
#lb_algo wrr
#lb_kind DR
persistence_timeout 60
protocol TCP

real_server 10.40.6.108 3306 {
    weight 3
    notify_down /usr/local/etc/keepalived/mysql.sh
    TCP_CHECK {
        connect_timeout 3
        nb_get_retry 3
        delay_before_retry 3
        connect_port 3306
    }
}

}

其中有两台集群很奇怪，real_ip分别为107和108，vip为117，当MySQL服务和keepalived服务都启动完成后，一切正常，107占有117的虚拟ip，此时测试切换，将mysql服务停止，按理说3306端口检查不健康的时候会执行我的mysql.sh脚本，实际上就是pkill keepalived，使备机占有vip，但实际上117的vip没有正常漂移到备机，而一直被主机占有，查看message日志发现一直报错：

Jul 12 16:09:12 hs-10-40-6-107 Keepalived_healthcheckers[9204]: TCP connection to [10.40.6.107]:3306 failed.
Jul 12 16:09:15 hs-10-40-6-107 Keepalived_healthcheckers[9204]: TCP connection to [10.40.6.107]:3306 failed.
Jul 12 16:09:15 hs-10-40-6-107 Keepalived_healthcheckers[9204]: Check on service [10.40.6.107]:3306 failed after 1 retry.
Jul 12 16:09:15 hs-10-40-6-107 Keepalived_healthcheckers[9204]: Removing service [10.40.6.107]:3306 from VS [10.40.6.117]:3306
Jul 12 16:09:15 hs-10-40-6-107 Keepalived_healthcheckers[9204]: IPVS: Service not defined
Jul 12 16:09:15 hs-10-40-6-107 Keepalived_healthcheckers[9204]: SMTP connection ERROR to [127.0.0.1]:25.
Jul 12 16:09:17 hs-10-40-6-107 Keepalived_healthcheckers[9204]: TCP connection to [10.40.6.107]:3306 failed.
Jul 12 16:09:20 hs-10-40-6-107 Keepalived_healthcheckers[9204]: TCP connection to [10.40.6.107]:3306 failed.
Jul 12 16:09:20 hs-10-40-6-107 Keepalived_healthcheckers[9204]: Check on service [10.40.6.107]:3306 failed after 1 retry.
Jul 12 16:09:20 hs-10-40-6-107 Keepalived_healthcheckers[9204]: Removing service [10.40.6.107]:3306 from VS [10.40.6.117]:3306
Jul 12 16:09:20 hs-10-40-6-107 Keepalived_healthcheckers[9204]: IPVS: Service not defined
Jul 12 16:09:20 hs-10-40-6-107 Keepalived_healthcheckers[9204]: SMTP connection ERROR to [127.0.0.1]:25.

然后重新恢复所有服务，测试从108切换到107，一切正常，108的mysql 停止之后，执行notify_down脚本，杀掉keepalived进程，从而使之前108所占用的vip 117备107所抢占，108的操作系统日志如下：
ul 12 14:18:40 hs-10-40-6-108 Keepalived_healthcheckers[6258]: TCP connection to [10.40.6.108]:3306 failed.
Jul 12 14:18:43 hs-10-40-6-108 Keepalived_healthcheckers[6258]: TCP connection to [10.40.6.108]:3306 failed.
Jul 12 14:18:43 hs-10-40-6-108 Keepalived_healthcheckers[6258]: Check on service [10.40.6.108]:3306 failed after 1 retry.
Jul 12 14:18:43 hs-10-40-6-108 Keepalived_healthcheckers[6258]: Removing service [10.40.6.108]:3306 from VS [10.40.6.117]:3306
Jul 12 14:18:43 hs-10-40-6-108 Keepalived_healthcheckers[6258]: IPVS: No such destination
Jul 12 14:18:43 hs-10-40-6-108 Keepalived_healthcheckers[6258]: Executing [/usr/local/etc/keepalived/mysql.sh] for service [10.40.6.108]:3306 in VS [10.40.6.117]:3306
Jul 12 14:18:43 hs-10-40-6-108 Keepalived_healthcheckers[6258]: Lost quorum 1-0=1 > 0 for VS [10.40.6.117]:3306
Jul 12 14:18:43 hs-10-40-6-108 Keepalived_healthcheckers[6258]: SMTP connection ERROR to [127.0.0.1]:25.
Jul 12 14:18:43 hs-10-40-6-108 Keepalived_vrrp[6259]: VRRP_Instance(VI_1) sent 0 priority
Jul 12 14:18:43 hs-10-40-6-108 Keepalived[6257]: Stopping
Jul 12 14:18:43 hs-10-40-6-108 Keepalived_vrrp[6259]: VRRP_Instance(VI_1) removing protocol VIPs.
Jul 12 14:18:43 hs-10-40-6-108 Keepalived_healthcheckers[6258]: Netlink reflector reports IP 10.40.6.117 removed
Jul 12 14:18:43 hs-10-40-6-108 Keepalived_healthcheckers[6258]: IPVS: No such file or directory
Jul 12 14:18:43 hs-10-40-6-108 Keepalived_healthcheckers[6258]: Stopped

今天一共装了6台机器，只有这一组主切备的时候有问题，notify_down 脚本一直不会执行，并且报错，不知道哪位大牛知道原因？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
普通网友 2016-10-04 11:00
关注
keepalived 切换后vip无法被备机接管，反之可以 1C
今天一共搭建了6台3组两两互备的centos 6.5 mysql+keepalived的主主复制+双backup模式的集群。主机107的keepalived.conf如下：
! Configuration File for keepalived
global_defs {
notification_email {
acassen@firewall.loc
failover@firewall.loc
sysadmin@firewall.loc
}
notification_email_from Alexandre.Cassen@firewall.loc
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id mysql_ha
vrrp_skip_check_adv_addr
vrrp_strict

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

keepalived+lvs重启后VIP消失？求解 linux 云计算运维
2022-05-10 22:11

回答 2 已采纳网上有人说是id冲突问题，我改了还是没用，启动了keepalived但是使用IP a命令无法查看到我的VIP，同时也无法ping通VIP
keepalived 备机启动自动从backup切换成master
2015-04-21 16:04

回答 1 已采纳关掉主备服务器的防火墙，备用服务器就可以进入BACKUP状态，而且启动关闭主服务器keepalived也可以实现主备切换。但正常情况下防火墙是不能关闭的，求高手最佳解决办法
keepalived + mysql 高可用 linux
2021-04-22 15:22

回答 3 已采纳你这个应该是keepalived配置问题，关看你的描述也不好判断问题，我这有一个keepalived+nginx的高可用配置(https://blog.csdn.net/qq_45348083/art
Mysql双主加Keepalived+读写分离
2019-11-04 14:33

小渣渣呦的博客一、MySQL于keepalived简介** 前言：在企业中，数据库高可用一直是企业的重中之重，中小企业很多都是使用mysql主从方案，一主多从，读写分离等，但是单主存在单点故障，从库切换成主库需要作改动。因此，如果是双主...
nginx+keepalived高可用 nginx 运维
2022-04-12 12:26

回答 1 已采纳 keepalived 需要添加nginx状态检测脚本，（例子加粗部分），当nginx异常时降权重，自然vip就会漂移 vrrp_script chk_ng{ script "/etc/k
keepalived vip 异常消失，重启keepalived 就又出现，进程没掉 centos linux 运维
2022-01-22 22:20

回答 4 已采纳 1、keepalived一般需要监控脚本联动，监控你的服务。你说的进程没有掉是你的服务进程在还是你的keepalived进程在？2、检查VIP没了的时候你原VIP所在主机的服务是否正常？
ubantu上keepalived+nginx实现高可用失败 ubuntu 负载均衡
2019-12-17 15:33

回答 1 已采纳很明显你的vip没有生成啊，用ip a命令应该是可以看到vip的，还是说你的vip在另一台机器上。
mysql地址漂移_keepalived应用：漂移IP的实现
2021-02-01 02:24

vera清浅的博客 state BACKUP：在keepalived中2...backup模式下，一旦主库宕机，虚拟ip会自动漂移到从库，当主库修复后，keepalived启动后，还会把虚拟ip抢占过来，即使设置了非抢占模式(nopreempt)抢占ip的动作也会发生。在backup-...
虚拟机版本CentOS Linux release 7.6.1810 (Core)下离线安装keepalived+nginx+supervisor bash centos java linux nginx
2019-08-21 10:50

回答 3 已采纳还是自己解决了，一个万能的办法，一劳永逸，以后再也不怕离线安装任何东西了。直接yum安装，然后看需要的依赖包，一个一个下载下来就完事儿了，这样一定是可以离线安装的
keepalived启动不输出日志？
2015-10-29 08:44

回答 2 已采纳 linux 下改 rsyslog.conf 或其中包含的目录文件
nginx+keeplived的vip映射问题 nginx
2018-10-31 03:40

回答 1 已采纳 https://blog.csdn.net/harryxxxxx/article/details/81092263
RabbitMQ集群安装配置+HAproxy+Keepalived高可用
2019-09-27 11:00

dengken829873708的博客 RabbitMQ集群安装配置+HAproxy+Keepalived高可用转自：https://www.linuxidc.com/Linux/2016-10/136492.htm rabbitmq 集群消息队列 RabbitMQ简介　RabbitMQ是流行的开源消息队列系统，用erlang语言开发。...
keepalived集群搭建 java 分布式架构
2023-01-31 12:26

回答 3 已采纳为啥上公有云了，不用对应的云服务吗？而且，根据你的集群情况来，有对应的云解决方案啊，例如负载均衡，在阿里就直接用ELB就好了，只有对应的云服务不能满足，才自建各种。而且，你用keepalived，要有
典型的高可用设计（二）：MySQL
2023-05-23 16:12

weichao9999的博客 MySQL数据库提供了数据库建的复制能力，做到了多个数据库同时拥有同一个数据副本，保证了数据的安全性，一台数据库服务器出现问题，其他数据库可以做到数据不丢失。MySQL的服务高可用设计也是以数据库复制能力为基础...
keepalived
2020-12-03 03:44

碗里没有汤的博客因此，Keepalived除了能够管理LVS软件外，还可以作为其他服务（例如：Nginx、Haproxy、MySQL等）的高可用解决方案软件。 Keepalived软件主要是通过VRRP协议实现高可用功能的。VRRP是Virtual Router ...
没有解决我的问题, 去提问

悬赏问题

¥15 oracle集群安装出bug
¥15 关于#python#的问题：自动化测试
¥20 问题请教！vue项目关于Nginx配置nonce安全策略的问题
¥15 教务系统账号被盗号如何追溯设备
¥20 delta降尺度方法，未来数据怎么降尺度
¥15 c# 使用NPOI快速将datatable数据导入excel中指定sheet，要求快速高效
¥15 再不同版本的系统上，TCP传输速度不一致
¥15 高德地图2.0 版本点聚合中Marker的位置无法实时更新，如何解决呢？
¥15 DIFY API Endpoint 问题。
¥20 sub地址DHCP问题

mysql+keepalived 切换后vip无法被备机接管，反之可以

1条回答 默认 最新

悬赏问题

1条回答默认最新