注册
数据守护集群的部署
专栏/技术分享/ 文章详情 /

数据守护集群的部署

M4x7 2025/07/18 229 0 0
摘要

数据守护集群(部署)

1 连接虚拟机和主机

虚拟机:

sudo apt update
sudo apt install openssh-server
sudo systemctl status ssh
sudo systemctl start ssh
sudo systemctl enable ssh
ip a
192.168.40.128

主机:

ssh max@192.168.40.128

2 安装dm8

lscpu
uname -a
cat /etc/os-release

x86-64 的Ubuntu

本地下载解压后上传到虚拟机

scp ./DMInstall.bin max@192.168.40.128:~/data
./DMInstall.bin -i

安装完成

3 配置相关文件

3.1 主机

3.1.1 实例化并启动
./dminit path=/home/max/dmdbms/data DB_NAME=PRIMARY INSTANCE_NAME=PRIMARY PAGE_SIZE=32 port_num=6093 SYSDBA_PWD='0X4c1a4d83' SYSAUDITOR_PWD='0X4c1a4d83'
./dmserver /home/max/dmdbms/data/PRIMARY/dm.ini

image

3.1.2 开启归档
./disql SYSDBA/0X4c1a4d83@192.168.40.128:6093
-- 挂载
ALTER DATABASE MOUNT;
-- 启动归档日志模式
ALTER DATABASE ARCHIVELOG;
-- 配置归档日志的保存路径和参数
ALTER DATABASE ADD ARCHIVELOG 'DEST=/home/max/dmdbms/data/PRIMARY/arch, TYPE=LOCAL, FILE_SIZE=1024, SPACE_LIMIT=51200';
-- 恢复打开状态
ALTER DATABASE OPEN;
3.1.3 备份数据
BACKUP DATABASE BACKUPSET '/home/max/dmdbms/data/PRIMARY/bak/BACKUP_FILE';

遇到问题:[-7170]:bakres连接DMAP失败。

image

社区中说时DMAP未启动,但是我发现DMAP服务未注册,于是注册服务

cd /home/max/dmdbms/script/root
./dm_service_installer.sh -t dmap -dm_ini /home/max/dmdbms/data/PRIMARY/dm.ini

image

启动服务

systemctl enable DmAPService.service
systemctl start DmAPService.service

备份成功

image

3.1.4 修改dm.ini
SQL> SP_SET_PARA_VALUE (2,'PORT_NUM',6093);
SQL> SP_SET_PARA_VALUE (2,'DW_INACTIVE_INTERVAL',60);
SQL> SP_SET_PARA_VALUE (2,'ALTER_MODE_STATUS',0);
SQL> SP_SET_PARA_VALUE (2,'ENABLE_OFFLINE_TS',2);
--启动主备同步、集群
SQL> SP_SET_PARA_VALUE (2,'MAL_INI',1);
SQL> SP_SET_PARA_VALUE (2,'RLOG_SEND_APPLY_MON',64);

关闭前台实例服务

3.1.5 修改dmarch.ini
ARCH_WAIT_APPLY            = 0   #0:高性能 1:事务一致
[ARCHIVE_LOCAL]
ARCH_TYPE                = LOCAL  #本地归档类型
ARCH_DEST                = /home/max/dmdbms/data/PRIMARY/arch  #本地归档存放路径
ARCH_FILE_SIZE           = 1024  #单个归档大小,单位 MB
ARCH_SPACE_LIMIT         = 51200  #归档上限,单位 MB

[ARCHIVE_REALTIME1]
ARCH_TYPE                = REALTIME  #实时归档类型
ARCH_DEST                = SECONDARY  #实时归档目标实例名
3.1.6 创建dmmal.ini
MAL_CHECK_INTERVAL         = 10  #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL     = 10  #判定 MAL 链路断开的时间
MAL_TEMP_PATH              = /home/max/dmdbms/data/malpath/PRIMARY  #临时文件目录
MAL_BUF_SIZE               = 512  #单个 MAL 缓存大小,单位 MB
MAL_SYS_BUF_SIZE           = 2048  #MAL 总大小限制,单位 MB
MAL_COMPRESS_LEVEL         = 0  #MAL 消息压缩等级,0 表示不压缩

[MAL_INST1]
MAL_INST_NAME            = PRIMARY  #实例名,和 dm.ini 的 INSTANCE_NAME 一致
MAL_HOST                 = 192.168.40.128  #MAL 系统监听 TCP 连接的 IP 地址
MAL_PORT                 = 5093  #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST            = 192.168.40.128  #实例的对外服务 IP 地址
MAL_INST_PORT            = 6093  #实例对外服务端口,和 dm.ini 的 PORT_NUM 一致
MAL_DW_PORT              = 5193  #实例对应的守护进程监听 TCP 连接的端口
MAL_INST_DW_PORT         = 5293  #实例监听守护进程 TCP 连接的端口

[MAL_INST2]
MAL_INST_NAME            = SECONDARY
MAL_HOST                 = 192.168.40.128
MAL_PORT                 = 5094
MAL_INST_HOST            = 192.168.40.128
MAL_INST_PORT            = 6094
MAL_DW_PORT              = 5194
MAL_INST_DW_PORT         = 5294
3.1.7 创建dmwatcher.ini
[GRP1]
DW_TYPE                  = GLOBAL  #全局守护类型
DW_MODE                  = AUTO  #MANUAL:故障手切 AUTO:故障自切
DW_ERROR_TIME            = 20  #远程守护进程故障认定时间
INST_ERROR_TIME          = 20  #本地实例故障认定时间
INST_RECOVER_TIME        = 60  #主库守护进程启动恢复的间隔时间
INST_OGUID               = 45331  #守护系统唯一 OGUID 值
INST_INI                 = /home/max/dmdbms/data/PRIMARY/dm.ini  #dm.ini 文件路径
INST_AUTO_RESTART        = 1  #打开实例的自动启动功能
INST_STARTUP_CMD         = /home/max/dmdbms/bin/dmserver  #命令行方式启动
RLOG_SEND_THRESHOLD      = 0  #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD     = 0  #指定备库重演日志的时间阈值,默认关闭
3.1.8 注册服务
sudo /home/max/dmdbms/script/root/dm_service_installer.sh -t dmserver -p PRIMARY -dm_ini /home/max/dmdbms/data/PRIMARY/dm.ini -m mount

sudo /home/max/dmdbms/script/root/dm_service_installer.sh -t dmwatcher -p Watcher -watcher_ini /home/max/dmdbms/data/PRIMARY/dmwatcher.ini

image

3.2 备机

3.2.1 初始化实例
./dminit path=/home/max/dmdbms/data DB_NAME=SECONDARY INSTANCE_NAME=SECONDARY PAGE_SIZE=32 port_num=6094 SYSDBA_PWD='0X4c1a4d83' SYSAUDITOR_PWD='0X4c1a4d83'
3.2.2 拷贝备份文件到B机器
## 这里是本机
scp -r /home/max/dmdbms/data/PRIMARY/bak/BACKUP_FILE /home/max/dmdbms/data/SECONDARY/bak/BACKUP_FILE

scp -r /opt/dmdbms/data/DAMENG/bak/BACKUP_FILE dmdba@192.168.1.2:/opt/dmdbms/data/DAMENG/bak
3.2.3 恢复数据
## 恢复数据库文件
/home/max/dmdbms/bin/dmrman CTLSTMT="RESTORE DATABASE '/home/max/dmdbms/data/SECONDARY/dm.ini' FROM BACKUPSET '/home/max/dmdbms/data/SECONDARY/bak/BACKUP_FILE'"
## 介质恢复,使其达到一致状态。
/home/max/dmdbms/bin/dmrman CTLSTMT="RECOVER DATABASE '/home/max/dmdbms/data/SECONDARY/dm.ini' FROM BACKUPSET '/home/max/dmdbms/data/SECONDARY/bak/BACKUP_FILE'"
## 恢复后更新 DB_MAGIC
/home/max/dmdbms/bin/dmrman CTLSTMT="RECOVER DATABASE '/home/max/dmdbms/data/SECONDARY/dm.ini' UPDATE DB_MAGIC"

image

3.2.4 替换 dmarch.ini
ARCH_WAIT_APPLY            = 0   #0:高性能 1:事务一致
[ARCHIVE_LOCAL]
ARCH_TYPE                = LOCAL  #本地归档类型
ARCH_DEST                = /home/max/dmdbms/data/SECONDARY/arch  #本地归档存放路径
ARCH_FILE_SIZE           = 1024  #单个归档大小,单位 MB
ARCH_SPACE_LIMIT         = 51200  #归档上限,单位 MB

[ARCHIVE_REALTIME1]
ARCH_TYPE                = REALTIME  #实时归档类型
ARCH_DEST                = PRIMARY  #实时归档目标实例名
3.2.5 配置 dm.ini
ALTER_MODE_STATUS = 0                     #不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS  = 2                      #不允许备库 OFFLINE 表空间
MAL_INI = 1                                           #打开 MAL 系统
ARCH_INI = 1                                         #打开归档配置
3.2.6 配置dmmal.ini 和 dmwatcher.ini

和主机几乎一样,只需要修改少部分地址即可

3.2.7 注册服务
sudo /home/max/dmdbms/script/root/dm_service_installer.sh -t dmserver -p SECONDARY -dm_ini /home/max/dmdbms/data/SECONDARY/dm.ini -m mount

sudo /home/max/dmdbms/script/root/dm_service_installer.sh -t dmwatcher -p Watcher2 -watcher_ini /home/max/dmdbms/data/SECONDARY/dmwatcher.ini

image

3.3 配置监视器

3.3.1 配置确认监视器
vi /home/max/dmdbms/bin/dmmonitor.ini

MON_DW_CONFIRM             = 1  #0:非确认(故障手切) 1:确认(故障自切)
MON_LOG_PATH               = ../log  #监视器日志文件存放路径
MON_LOG_INTERVAL           = 60  #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE          = 512  #单个日志大小,单位 MB
MON_LOG_SPACE_LIMIT        = 2048  #日志上限,单位 MB

[GRP1]
MON_INST_OGUID           = 45331  #组 GRP1 的唯一 OGUID 值
MON_DW_IP                = 192.168.40.128:6093  #IP 对应 MAL_HOST,PORT 对应 MAL_DW_PORT
MON_DW_IP                = 192.168.40.128:6094
3.3.2 配置非确认监视器

集群各节点的 bin 目录中,存放非确认监视器配置文件。

说明:在配置监视器时,一般配置好确认监视器后,建议再配置一个非确认监视器的配置文件,在主备发生切换时,可以通过前台的方式启动非确认监视器进行手动切换。非确认监视器是通过将监视器配置文件中 MON_DW_CONFIRM 参数值修改为 0 来实现。

vi /home/max/dmdbms/bin/dmmonitor_manual.ini

MON_DW_CONFIRM             = 0  #0:非确认(故障手切) 1:确认(故障自切)
MON_LOG_PATH               = ../log  #监视器日志文件存放路径
MON_LOG_INTERVAL           = 60  #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE          = 512  #单个日志大小,单位 MB
MON_LOG_SPACE_LIMIT        = 2048  #日志上限,单位 MB

[GRP1]
MON_INST_OGUID           = 45331  #组 GRP1 的唯一 OGUID 值
MON_DW_IP                = 192.168.40.128:5193  #IP 对应 MAL_HOST,PORT 对应 MAL_DW_PORT
MON_DW_IP                = 192.168.40.128:5194
3.3.3 注册服务

非确认监视器无需注册服务。

sudo /home/max/dmdbms/script/root/dm_service_installer.sh -t dmmonitor -p Monitor -monitor_ini /home/max/dmdbms/bin/dmmonitor.ini

至此,已经部署完成

4 启动并验证

4.1启动服务

启动主机服务

./DmServicePRIMARY start
./disql SYSDBA/0X4c1a4d83@192.168.40.128:6093
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SP_SET_OGUID(45331);
ALTER DATABASE PRIMARY;
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);

启动备机服务

./DmServiceSECONDARY start
./disql SYSDBA/0X4c1a4d83@192.168.40.128:6094
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SP_SET_OGUID(45331);
ALTER DATABASE STANDBY;
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);

image

启动守护进程

./DmWatcherServiceWatcher start
./DmWatcherServiceWatcher2 start

image

启动监视器

##后台启动
./DmMonitorServiceMonitor start

##前台启动
./dmmonitor /opt/dmdbms/bin/dmmonitor.ini

image

##查看集群状态
tip
show
##登录非确认监视器
login
##查看满足切换条件的实例
choose switchover GRP1
##主备切换
switchover GRP1.SECONDARY

问题1:启动后发现两个节点都处于mount状态

image

原因:发现是两个节点的FLSN和CLSN不同步。

解决:手动重新备份后解决。

问题2:然后在一次调参后,启动发现:Monitor可以连接到SECONDARY节点,但是却接收不到任何内容。通过查阅~/dmdbms/log/dm_dmwatcher_SECONDARY_202507.log,发现如下内容:

2025-07-16 01:11:24.589 [INFO] dmwatcher P0000026559 T0000000000000027230  Instance: 守护进程状态(STARTUP) 实例状态(OK) 实例名(PRIMARY) 模式(PRIMARY) 实例状态(MOUNT) 归档状态(INVALID) POCNT(1) FLSN(46026) CLSN(46
026) SLSN(46026) SSLSN(46026)
2025-07-16 01:11:24.909 [INFO] dmwatcher P0000026559 T0000000000000026564  dw2_tcp_conn_startup, oguid(45331) configured in dmwatcher.ini not equal with local dmserver's oguid(0)!

原因:在 dmwatcher.ini 配置的 OGUID = 45331,但启动的 dmserver 实例中,并没有设置这个 OGUID

解决:

## 进入 disql 连接SECONDARY:
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SP_SET_OGUID(45331);
ALTER DATABASE STANDBY; 
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);

发现问题解决了。

image

注1:如果VMware的Ubuntu虚拟机黑屏了但可以远程ssh到,可以输入下面命令重启图形界面

sudo systemctl restart gdm

注2达梦数据库的主备同步系统 不能使用本地回环地址(loopback address) 127.0.0.1 作为 MAL 系统的 IP 地址。

注3:查看当前运行的dm进程

ps -ef | grep dm
评论
后发表回复

作者

文章

阅读量

获赞

扫一扫
联系客服