集群配置健康检查

数据守护集群

网络环境核查按照服务器网卡检查中的方法检查网卡详情;集群节点时间检查按照服务器时间检查中的方法检查各节点服务器时间;本章节对数据守护集群检查不再赘述。

守护集群监视器

通过监视器,可以监控数据守护系统的运行情况,获取主备库状态、守护进程状态、以及主备库数据同步情况等信息。同时,监视器 (dmmonitor) 还提供了一系列命令来管理数据守护系统,监视器属于集群的仲裁机,需要确认是否可用。检查监视器是否可用,前台启动监视器,命令如下所示:

./dmmonitor dmmonitor.ini

2_1_3_01

监视器集群检查:输入 show 命令。

2_1_3_02

可以监控到所有实例都处于 Open 状态,所有守护进程也都处于 Open 状态,即为正常运行状态。

备注

建议部署载第三台服务器上并且和数据库版本保持一致,服务器配置达到最低 DM 数据库安装的脚本,如果配置自动切换,请确保服务器上有一个确认监视器载后台正常运行。

切换模式

切换模式分为自动切换和手动切换,可检查主备库 dmwatcher.ini 文件的 DW_MODE 参数。

  • MANUAL

故障手动切换模式,故障时前台启动监视器进行切换。

  • AUTO

故障自动切换模式,需要后台运行确认监视器。

2_1_4_01

DSC 集群

网络环境核查按照服务器网卡检查中的方法检查网卡详情;集群节点时间检查按照服务器时间检查中的方法检查各节点服务器时间;本章节对 DSC 集群检查不再赘述。

归档检查

检查数据库归档配置文件是否有配置远程归档及本地归档。

2_3_3_01

  • ARCH_TYPE
    • LOCAL 本地归档模式
    • REMOTE 远程归档模式

DSC 集群监视器

需要在监视器中确认各实例状态是否为 open 状态,命令如下所示:

$DM_HOME/bin/dmcssm ini_path=dmcssm.ini

2_3_4_01

可以监控到所有实例都处于 Open 状态,实例的集群状态处于 WORKING 即为正常运行状态。

MPP 集群

网络环境核查按照服务器网卡检查中的方法检查网卡详情;集群节点时间检查按照服务器时间检查中的方法检查各节点服务器时间;本章节对 MPP 集群检查不再赘述。

HA 集群

网络环境核查按照服务器网卡检查中的方法检查网卡详情;集群节点时间检查按照服务器时间检查中的方法检查各节点服务器时间;本章节对 HA 集群检查不再赘述。

配置文件检查

因为 HA 是操作系统的高可用软件,所以详细的检查方式,请咨询 HA 软件的厂商。

数据库参数配置:HA 要配置 IP 互斥 (HA_INST_CHECK_IP,HA_INST_CHECK_PORT),检查各节点 dm.ini 配置参数,命令如下所示:

HA_INST_CHECK_IP:HA 实例启动检测 IP,需要配置为另一个节点的 ip
HA_INST_CHECK_PORT:HA 实例监听端口

2_5_1_01

节点 ini 文件检查

检查 HA 各节点 $DM_HOME/bin 目录下是否都存放相同的 dm.ini 文件,命令如下所示:

cd $DM_HOME/bin
ls -al dm.ini

挂载目录检查

检查 HA 各节点 DM 相关的挂载目录是否保持一致,命令如下所示:

df -h --检查dmdata dmarch dmbak 目录是否各节点保持一致
微信扫码
分享文档
扫一扫
联系客服