为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。
【DM版本】:DM8
【操作系统】:ky10.aarch64
【CPU】:Kunpeng-920
【问题描述】*:请问一下,主备机群报错连接不上,[ERROR] database P0000374457 T0000000000000374523 self_site(0) to dest_site(1) port_closed,return EC_CONNECT_LOST,后面又会被dmdatawatch重新拉起,可以正常使用,这个报错有什么排查思路吗?看着像是网络问题?
这个报错是心跳网络丢失连接了,可以看下这个报错之前是否还有其它报错,比如OOM了导致库在重启,或者进程core了,如果之前有类似这种其它操作,这个就是结果,得看下为什么OOM或者core这类的。如果之前没有其它操作,这个就是根本原因,当时机器之间心跳网络有问题导致,如果出现频繁,可以考虑用ping、telnet等持续监控下心跳网络