为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。
【DM版本】:dm7.6
【操作系统】:Red Hat Enterprise Linux Server release 6.8 (Santiago)
【CPU】:
【问题描述】*:我说下我装集群的顺序:
1、先在1节点主库 2节点备库装好数据库,防火墙关闭 检查网络都没问题。
2、1节点数据库先open下 ,然后关闭,冷备份到2节点restore,recover
(这个时候发现file_lsn,cur_lsn一致,但是n_magic,db_magic并不一样 是这个原因吗?但是我达梦7rman恢复就是这样的。如果是这个与那样导致的 我改如何改备库的n_magic,db_magic呢?)
3、后续1节点和2节点始终都是mount状态。配置好各类文件,然后最后启动dmwatcher和dmmonitor ,全程命令无报错。
4、这时候dmmonitor命令查看就是1节点主库是open的 ,2节点备库就是mount状态。
我看了下2节点备库的日志,有如下报错:
dw2_group_tcp_recv_thread, receive tcp msg failed, close tcp port, vio:7, mid:1716881474, from_flag:1, errno:0, error:Failure occurs in data_recv_inet_once, code 0, code:-6007
而且一节点主库的归档日志也没有传送到二节点备库
请问有没有大佬遇见过这么诡异的情况?如有赐教 不胜感激。
主库配置文件
备库配置文件
1、主备库的dmwatcher服务是否正常,需要检查一下,同时您对应设置的端口是否都开放正常,有没有被占用。(很重要)。
2、按您描述的的"1节点数据库先open下 ,然后关闭,冷备份到2节点restore"这里主备数据库实例是否都初始化完后启动过一次?
3、可以尝试登录监视器通过监视器命令去open备库看下,命令:open database 实例名称
1 首先推荐使用DM8新版本,以获得集群性能体验。
2 从日志和监视器信息看,两方面问题,1个是mal网络的tcp连接问题,建议排查网络、端口是否互通; 2是监视器看你备库还原之后归档状态及LSN,跟主库相差很大,备库还原后,有mount启动后执行相关sp_set_oguid(82379); 相关语句吗,
备库还原执行完后,执行下检查语句,相关状态都是否正常,再开始启动主备数据守护程序
情况这个问题解决了嘛,我的直接是两个都mount
是不是恢复备库的时候没有UPDATE DB_MAGIC,
可以参考一下ECO上的文档步骤。(应该大致上差不多的)
https://eco.dameng.com/document/dm/zh-cn/ops/DW-installation-cluster.html#2.2.2%20%E6%81%A2%E5%A4%8D%E6%95%B0%E6%8D%AE