注册
达梦数据库守护集群安装部署
技术分享/ 文章详情 /

达梦数据库守护集群安装部署

wxh 2025/10/24 56 0 0

达梦数据库守护集群安装部署

1. 主备机规划

IP 端口 实例名
192.168.188.101 主机 5236 GRP1_RT_01
192.168.188.102 备机 5236 GRP1_RT_02
192.168.188.103 监视器 5236

2. 安装主机和备机

此文不细讲,详情见其他单机安装文章

3. 主库配置和备份

  1. 初始化实例,在bin/目录下输入:

    [dmdba@~]$ /home/dmdba/dmdbms/bin/dminit PATH=/dmdata/data/ INSTANCE_NAME=GRP1_RT_01 PAGE_SIZE=32 EXTENT_SIZE=32 LOG_SIZE=2048 SYSDBA_PWD=****** SYSAUDITOR_PWD=******
  2. 启动服务,输入:

    $./dmserver /dmdata/data/DMTEST/dm.ini
  3. 开启归档,打开disql,然后备份数据。

    ./disql SYSDBA/******* SQL> ALTER DATABASE MOUNT; SQL> ALTER DATABASE ARCHIVELOG; SQL> ALTER DATABASE ADD ARCHIVELOG 'DEST=/dmdata/arch, TYPE=LOCAL, FILE_SIZE=1024, SPACE_LIMIT=20480'; SQL> ALTER DATABASE OPEN; SQL> BACKUP DATABASE BACKUPSET '/dmdata/dmbak/BACKUP_FILE';
  4. 修改dm.ini,同样在打开的SQL窗口中输入

    SQL> SP_SET_PARA_VALUE (2,'PORT_NUM',5236); SQL> SP_SET_PARA_VALUE (2,'DW_INACTIVE_INTERVAL',60); SQL> SP_SET_PARA_VALUE (2,'ALTER_MODE_STATUS',0); SQL> SP_SET_PARA_VALUE (2,'ENABLE_OFFLINE_TS',2); SQL> SP_SET_PARA_VALUE (2,'MAL_INI',1); SQL> SP_SET_PARA_VALUE (2,'RLOG_SEND_APPLY_MON',64);
  5. 关闭服务

  6. 新建dmarch.ini文件

    [dmdba@~]$ vim /dmdata/data/DMTEST/dmarch.ini ARCH_WAIT_APPLY = 0 #0:高性能 1:事务一致 [ARCHIVE_LOCAL] ARCH_TYPE = LOCAL #本地归档类型 ARCH_DEST = /dmdata/arch/ #本地归档存放路径 ARCH_FILE_SIZE = 1024 #单个归档大小,单位 MB ARCH_SPACE_LIMIT = 20480 #归档上限,单位 MB [ARCHIVE_REALTIME1] ARCH_TYPE = REALTIME #实时归档类型 ARCH_DEST = GRP1_RT_02 #实时归档目标实例名
  7. 新建dmmal.ini文件

    [dmdba@~]$ vi /dmdata/data/DMTEST/dmmal.ini MAL_CHECK_INTERVAL = 10 #MAL 链路检测时间间隔 MAL_CONN_FAIL_INTERVAL = 10 #判定 MAL 链路断开的时间 MAL_TEMP_PATH = /dmdata/malpath/ #临时文件目录 MAL_BUF_SIZE = 512 #单个 MAL 缓存大小,单位 MB MAL_SYS_BUF_SIZE = 2048 #MAL 总大小限制,单位 MB MAL_COMPRESS_LEVEL = 0 #MAL 消息压缩等级,0 表示不压缩 [MAL_INST1] MAL_INST_NAME = GRP1_RT_01 #实例名,和 dm.ini 的 INSTANCE_NAME 一致 MAL_HOST = 192.168.188.101 #MAL 系统监听 TCP 连接的 IP 地址 MAL_PORT = 5336 #MAL 系统监听 TCP 连接的端口 MAL_INST_HOST = 192.168.188.101 #实例的对外服务 IP 地址 MAL_INST_PORT = 5236 #实例对外服务端口,和 dm.ini 的 PORT_NUM 一致 MAL_DW_PORT = 5436 #实例对应的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5536 #实例监听守护进程 TCP 连接的端口 [MAL_INST2] MAL_INST_NAME = GRP1_RT_02 MAL_HOST = 192.168.188.102 MAL_PORT = 5336 MAL_INST_HOST = 192.168.188.102 MAL_INST_PORT = 5236 MAL_DW_PORT = 5436 MAL_INST_DW_PORT = 5536
  8. 新建dmwatcher.ini文件

    [dmdba@~]$ vi /dmdata/data/DMTEST/dmwatcher.ini [GRP1] DW_TYPE = GLOBAL #全局守护类型 DW_MODE = AUTO #MANUAL:故障手切 AUTO:故障自切 DW_ERROR_TIME = 20 #远程守护进程故障认定时间 INST_ERROR_TIME = 20 #本地实例故障认定时间 INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间 INST_OGUID = 45331 #守护系统唯一 OGUID 值 INST_INI = /dmdata/data/DMTEST/dm.ini #dm.ini 文件路径 INST_AUTO_RESTART = 1 #打开实例的自动启动功能 INST_STARTUP_CMD = /home/dmdba/dmdbms/bin/dmserver #命令行方式启动 RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭 RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
  9. 将主库的备份文件拷贝到备库,可以用Xftp也可以输入以下命令

    $ scp -r /dmdata/dmbak/BACKUP_FILE dmdba@192.168.188.102:/dmdata/dm bak/
  10. 注册主机的服务和守护线程

    [root@~]$ /home/dmdba/dmdbms/script/root/dm_service_installer.sh -t dmserver -p GRP1_RT_01 -dm_ini /dmdata/data/DMTEST/dm.ini -m mount [root@~]$ /home/dmdba/dmdbms/script/root/dm_service_installer.sh -t dmwatcher -p Watcher -watcher_ini /dmdata/data/DMTEST/dmwatcher.ini

4. 备库配置

  1. 初始化实例

    [dmdba@~]$ /home/dmdba/dmdbms/bin/dminit PATH=/dmdata/data/ INSTANCE_NAME=GRP1_RT_02 PAGE_SIZE=32 EXTENT_SIZE=32 LOG_SIZE=2048 SYSDBA_PWD=****** SYSAUDITOR_PWD=******
  2. 在备库bin目录下打开dmrman还原备份。

$./dmramn RESTORE DATABASE to '/dmdata/data/DMTEST' FROM BACKUPSET '/dmdata/dmbak/BACKUP_FILE' RECOVER DATABASE '/dmdata/data/DMTEST/dm.ini' UPDATE DB_MAGIC

image20250810182210767.png

  1. 修改dm.ini参数配置
vim /dmdata/data/DMTEST/dm.ini INSTANCE_NAME = GRP1_RT_02 PORT_NUM = 5236 #数据库实例监听端口 DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间 ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间 MAL_INI = 1 #打开 MAL 系统 ARCH_INI = 1 #打开归档配置 RLOG_SEND_APPLY_MON = 64 #统计最近 64 次的日志重演信息
  1. 主库一样创建dmarch.ini配置文件
vim /dmdata/data/DMTEST/dmarch.ini ARCH_WAIT_APPLY = 0 #0:高性能 1:事务一致 [ARCHIVE_LOCAL] ARCH_TYPE = LOCAL #本地归档类型 ARCH_DEST = /dmdata/data/arch/ #本地归档存放路径 ARCH_FILE_SIZE = 1024 #单个归档大小,单位 MB ARCH_SPACE_LIMIT = 20480 #归档上限,单位 MB [ARCHIVE_REALTIME1] ARCH_TYPE = REALTIME #实时归档类型 ARCH_DEST = GRP1_RT_01 #实时归档目标实例名
  1. 和主库一样创建dmmal.ini配置文件
vim /dmdata/data/DATEST/dmmal.ini MAL_CHECK_INTERVAL = 10 #MAL 链路检测时间间隔 MAL_CONN_FAIL_INTERVAL = 10 #判定 MAL 链路断开的时间 MAL_TEMP_PATH = /dmdata/malpath/ #临时文件目录 MAL_BUF_SIZE = 512 #单个 MAL 缓存大小,单位 MB MAL_SYS_BUF_SIZE = 2048 #MAL 总大小限制,单位 MB MAL_COMPRESS_LEVEL = 0 #MAL 消息压缩等级,0 表示不压缩 [MAL_INST1] MAL_INST_NAME = GRP1_RT_01 #实例名,和 dm.ini 的 INSTANCE_NAME 一致 MAL_HOST = 192.168.188.101 #MAL 系统监听 TCP 连接的 IP 地址 MAL_PORT = 5336 #MAL 系统监听 TCP 连接的端口 MAL_INST_HOST = 192.168.188.101 #实例的对外服务 IP 地址 MAL_INST_PORT = 5236 #实例对外服务端口,和 dm.ini 的 PORT_NUM 一致 MAL_DW_PORT = 5436 #实例对应的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5536 #实例监听守护进程 TCP 连接的端口 [MAL_INST2] MAL_INST_NAME = GRP1_RT_02 MAL_HOST = 192.168.188.102 MAL_PORT = 5336 MAL_INST_HOST = 192.168.188.102 MAL_INST_PORT = 5236 MAL_DW_PORT = 5436 MAL_INST_DW_PORT = 5536
  1. 主库一样创建dmwatcher.ini配置文件
vim /dmdata/data/DATEST/dmwatcher.ini [GRP1] DW_TYPE = GLOBAL #全局守护类型 DW_MODE = AUTO #MANUAL:故障手切 AUTO:故障自切 DW_ERROR_TIME = 20 #远程守护进程故障认定时间 INST_ERROR_TIME = 20 #本地实例故障认定时间 INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间 INST_OGUID = 45331 #守护系统唯一 OGUID 值 INST_INI = /dmdata/data/DMTEST/dm.ini #dm.ini 文件路径 INST_AUTO_RESTART = 1 #打开实例的自动启动功能 INST_STARTUP_CMD = /home/dmdba/dmdbms/bin/dmserver #命令行方式启动 RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭6. 配置监视器

5. 配置监视器

  1. 在bin目录下创建dmmonitor.ini文件

    [dmdba@~]$ vim /home/dmdba/dmdbms/bin/dmmonitor.ini MON_DW_CONFIRM = 1 #0:非确认(故障手切) 1:确认(故障自切) MON_LOG_PATH = ../log #监视器日志文件存放路径 MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件 MON_LOG_FILE_SIZE = 512 #单个日志大小,单位 MB MON_LOG_SPACE_LIMIT = 2048 #日志上限,单位 MB [GRP1] MON_INST_OGUID = 45331 #组 GRP1 的唯一 OGUID 值 MON_DW_IP = 192.168.188.101:5436 #IP 对应 MAL_HOST,PORT 对应 MAL_DW_PORT MON_DW_IP = 192.168.188.102:5436
  2. 再配置一个非确认监视器的配置文件,在主备发生切换时,可以通过前台的方式启动非确认监视器进行手动切换。非确认监视器是通过将监视器配置文件MON_DW_CONFIRM 参数值修改为 0 来实现

    [dmdba@~]$ vim /home/dmdba/dmdbms/bin/dmmonitor.ini MON_DW_CONFIRM = 0 #0:非确认(故障手切) 1:确认(故障自切) MON_LOG_PATH = ../log #监视器日志文件存放路径 MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件 MON_LOG_FILE_SIZE = 512 #单个日志大小,单位 MB MON_LOG_SPACE_LIMIT = 2048 #日志上限,单位 MB [GRP1] MON_INST_OGUID = 45331 #组 GRP1 的唯一 OGUID 值 MON_DW_IP = 192.168.188.101:5436 #IP 对应 MAL_HOST,PORT 对应 MAL_DW_PORT MON_DW_IP = 192.168.188.102:5436
  3. 注册服务

    [root@~]# /home/dmdba/dmdbms/script/root/dm_service_installer.sh -t dmmonitor -p Monitor -monitor_ini /home/dmdba/dmdbms/bin/dmmonitor.ini

6. 启动主库备库和监视器

  1. 启动主库备库服务并修改参数

    ##A 机器 [dmdba@~]$ /home/dmdba/dmdbms/bin/DmServiceGRP1_RT_01 start [dmdba@~]$ /home/dmdba/dmdbms/bin/disql SYSDBA/*****@192.168.188.101 SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1); SQL> SP_SET_OGUID(45331); SQL> ALTER DATABASE PRIMARY; SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0); ##B 机器 [dmdba@~]$ /home/dmdba/dmdbms/bin/DmServiceGRP1_RT_02 start [dmdba@~]$ /home/dmdba/dmdbms/bin /disql SYSDBA/*****@192.168.188.102 SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1); SQL> SP_SET_OGUID(45331); SQL> ALTER DATABASE STANDBY; SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
  2. 启动主库和备库的守护线程

    ##A/B机器 [dmdba@~]$ /home/dmdba/dmdbms/bin/DmWatcherServiceWatcher start
  3. 启动监视器

##后台启动
[dmdba@~]$ /home/dmdba/dmdbms/bin/DmMonitorServiceMonitor start

##前台启动
[dmdba@~]$ /home/dmdba/dmdbms/bin/dmmonitor /home/dmdba/dmdbms/bin/dmmonitor.ini

7. 监视器的使用

命令 含义
list 查看守护进程的配置信息
show global info 查看所有实例组的信息
tip 查看系统当前运行状态
login 登录监视器
logout 退出登录
choose switchover GRP1 主机正常:查看可切换为主机的实例列表
switchover GRP1.实例名 主机正常:使用指定组的指定实例,切换为主机
choose takeover GRP1 主机故障:查看可切换为主机的实例列表
takeover GRP1.实例名 主机故障:使用指定组的指定实例,切换为主机
choose takeover force GRP1 强制切换:查看可切换为主机的实例列表
takeover force GRP1.实例名 强制切换:使用指定组的指定实例,切换为主机

对于在生产环境中配置有确认监视器时,主备只是发生了切换的情况下,再想将主备切换回去时,只需要启动非确认监视器执行切换命令即可。

例如,有主库 GRP1_RT_01 与备库 GRP1_RT_02 发生切换,恢复方法如下:

  1. 通过前台方式启动非确认监视器。
./dmmonitor dmmonitor_manual.ini

image.png

从监视器中可以看到 GRP1_RT_02 变成了主库,GRP1_RT_01 变成了备库。

  1. 检查集群状态。

可通过监视器命令"tip"或"show"来检查集群状态是否正常。

image.png

通过 “tip” 命令可以看到集群状态正常。

  1. 登录非确认监视器。

在非确认监视器中输入"login"再输入用户名和密码登录监视器。

image.png

  1. 查看满足切换条件的实例。

输入命令"choose switchover 组名"查看可切换为主机的实例列表。

choose switchover GRP1

image.png

可以看到 GRP1_RT_01 可以进行切换。

  1. 主备切换。

执行命令"switchover GRP1.实例名"进行切换。

switchover GRP1.GRP1_RT_01

image.png

切换成功,GRP1_RT_01 恢复到主库对外提供服务。

  1. 退出非确认监视器。

先通过监视器命令"tip"和"show"检查当前集群状态。

image.png

集群状态正常,执行“exit”命令退出监视器。

评论
后发表回复

作者

文章

阅读量

获赞

扫一扫
联系客服