为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。
【DM版本】:DM Database Server x64 V8 2-2-18-21.06.28-142526-10013-SEC
【操作系统】:麒麟v10
【CPU】:FT
【问题描述】*:主备集群环境
问题描述:
数据库实例进程运行中,突然停止(SM服务器,DM主备集群正式环境,实例服务突然停止多次),经过梳理实例服务停止时间段日志如下:1、数据库监视器日志,2、数据库守护日志,3、数据库实例日志,4、操作系统日志,5、数据库实例收到的sql日志;
数据守护给实例发送SHUTDOWN ABOUT,导致数据库实例被关闭,
如何分析如何解决?求答案
详细日志见附件
哪位老师有分析网络不稳定的好方法?
最终定位:问题根本是在网路层面,系统时间同步方面!
目前解决方法:通过修改数据库故障认定时间,链路断开时间提高容错能力!
您好,通过你的日志看主要可以从两方面排查:
1.查看watcher日志报错显示,由于监视器10s内没有收到dmwatcher的消息导致,因此可以从网络方面先进行分析;
2.通过操作系统日志发现时间发生过改变,因此可以从时间是否发生过跳跃导致