为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。
【DM版本】:
【操作系统】:
【CPU】:
【问题描述】*:一台服务器上面有两个实例,和另外一个服务器组成2套主备集群,配置的自动切换。备机和确认监视器在同一机房,备机做网络变更时,一个集群出现脑裂,一个正常。对比一下,除了dmwacher.ini 配置故障时间不一样。INST_ERROR_TIME和DW_ERROR_TIME
出现脑裂的配置如下;备库所在的机房做网络变更时,守护进程进行了takeover
正常的如下,另外一组集群,一台服务器上面有4个实例,配置如下的都没有问题
DW_ERROR_TIME 守护进程故障认定时间,单位为秒,取值范围为 3~32767,缺省 15 秒没有收到远程守护进程消息,即认定远程守护进程故障,对本地守护无效。
另外此参数也是监视器认定守护进程的故障时间,超过设置的时间间隔仍没有收到守护进程消息,监视器认为守护进程出现故障
INST_ERROR_TIME 数据库故障认定时间,单位秒,取值范围为 3~32767,缺省 15 秒没有收到数据库发送的状态信息,即认定其监控的数据库出现故障
INST_ERROR_TIME DW_ERROR_TIME配置时间过段,可能会导致切换很频繁,因此建议根据实际情况适当调大值
详情可以参考手册说明:
https://eco.dameng.com/document/dm/zh-cn/pm/configuration-description.html#5.4%20dmwatcher.ini