问题描述:2台物理服务器部署2节点自动切换主备集群,集群主备自动切换以及数据同步功能皆正常,集群服务注册操作系统自启动;客户重启服务器,主备集群服务无法被自动拉起
问题分析:
1、怀疑是集群服务有问题,但集群服务通过手动启动方式,可正常拉起,日志无报错信息;
2、经多轮重启尝试发现,数据库实例偶尔可被操作系统自动拉起,偶尔不可被自动拉起;数据守护dmwatcher服务一直无法自动拉起;
3、数据库实例在无法被操作系统自动拉起时,数据库日志提示以下报错信息:
self instance(BDzX1) mal ip(x.x.x.x) config error, it’s not local ip
INI parameter DPc 2Pc changed, the original value 1, new value 0
dmserver startup failed, code = -215p [Invalid IP]
注:x.x.x.x为心跳网卡IP
问题定位:
通过咨询操作系统工程师,结合数据库日志,最终定位原因为心跳网卡启动延迟,导致数据库集群服务自启动时,无法识别到已配置的心跳IP,顾数据库集群服务无法自启动;
解决方法:
linux环境下,在/usr/lib/systemd/system/目录下,修改数据库集群注册的服务文件,修改如下信息
After=network.target network-online.target remote-fs.target
问题得到解决,服务器重启后,主备集群服务自动被操作系统拉起,集群服务正常。
文章
阅读量
获赞