虚拟机:
sudo apt update
sudo apt install openssh-server
sudo systemctl status ssh
sudo systemctl start ssh
sudo systemctl enable ssh
ip a
192.168.40.128
主机:
ssh max@192.168.40.128
lscpu
uname -a
cat /etc/os-release
x86-64 的Ubuntu
本地下载解压后上传到虚拟机
scp ./DMInstall.bin max@192.168.40.128:~/data
./DMInstall.bin -i
安装完成
./dminit path=/home/max/dmdbms/data DB_NAME=PRIMARY INSTANCE_NAME=PRIMARY PAGE_SIZE=32 port_num=6093 SYSDBA_PWD='0X4c1a4d83' SYSAUDITOR_PWD='0X4c1a4d83'
./dmserver /home/max/dmdbms/data/PRIMARY/dm.ini
./disql SYSDBA/0X4c1a4d83@192.168.40.128:6093
-- 挂载
ALTER DATABASE MOUNT;
-- 启动归档日志模式
ALTER DATABASE ARCHIVELOG;
-- 配置归档日志的保存路径和参数
ALTER DATABASE ADD ARCHIVELOG 'DEST=/home/max/dmdbms/data/PRIMARY/arch, TYPE=LOCAL, FILE_SIZE=1024, SPACE_LIMIT=51200';
-- 恢复打开状态
ALTER DATABASE OPEN;
BACKUP DATABASE BACKUPSET '/home/max/dmdbms/data/PRIMARY/bak/BACKUP_FILE';
遇到问题:[-7170]:bakres连接DMAP失败。
社区中说时DMAP未启动,但是我发现DMAP服务未注册,于是注册服务
cd /home/max/dmdbms/script/root
./dm_service_installer.sh -t dmap -dm_ini /home/max/dmdbms/data/PRIMARY/dm.ini
启动服务
systemctl enable DmAPService.service
systemctl start DmAPService.service
备份成功
SQL> SP_SET_PARA_VALUE (2,'PORT_NUM',6093);
SQL> SP_SET_PARA_VALUE (2,'DW_INACTIVE_INTERVAL',60);
SQL> SP_SET_PARA_VALUE (2,'ALTER_MODE_STATUS',0);
SQL> SP_SET_PARA_VALUE (2,'ENABLE_OFFLINE_TS',2);
--启动主备同步、集群
SQL> SP_SET_PARA_VALUE (2,'MAL_INI',1);
SQL> SP_SET_PARA_VALUE (2,'RLOG_SEND_APPLY_MON',64);
关闭前台实例服务
ARCH_WAIT_APPLY = 0 #0:高性能 1:事务一致
[ARCHIVE_LOCAL]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /home/max/dmdbms/data/PRIMARY/arch #本地归档存放路径
ARCH_FILE_SIZE = 1024 #单个归档大小,单位 MB
ARCH_SPACE_LIMIT = 51200 #归档上限,单位 MB
[ARCHIVE_REALTIME1]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = SECONDARY #实时归档目标实例名
MAL_CHECK_INTERVAL = 10 #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 10 #判定 MAL 链路断开的时间
MAL_TEMP_PATH = /home/max/dmdbms/data/malpath/PRIMARY #临时文件目录
MAL_BUF_SIZE = 512 #单个 MAL 缓存大小,单位 MB
MAL_SYS_BUF_SIZE = 2048 #MAL 总大小限制,单位 MB
MAL_COMPRESS_LEVEL = 0 #MAL 消息压缩等级,0 表示不压缩
[MAL_INST1]
MAL_INST_NAME = PRIMARY #实例名,和 dm.ini 的 INSTANCE_NAME 一致
MAL_HOST = 192.168.40.128 #MAL 系统监听 TCP 连接的 IP 地址
MAL_PORT = 5093 #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST = 192.168.40.128 #实例的对外服务 IP 地址
MAL_INST_PORT = 6093 #实例对外服务端口,和 dm.ini 的 PORT_NUM 一致
MAL_DW_PORT = 5193 #实例对应的守护进程监听 TCP 连接的端口
MAL_INST_DW_PORT = 5293 #实例监听守护进程 TCP 连接的端口
[MAL_INST2]
MAL_INST_NAME = SECONDARY
MAL_HOST = 192.168.40.128
MAL_PORT = 5094
MAL_INST_HOST = 192.168.40.128
MAL_INST_PORT = 6094
MAL_DW_PORT = 5194
MAL_INST_DW_PORT = 5294
[GRP1]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #MANUAL:故障手切 AUTO:故障自切
DW_ERROR_TIME = 20 #远程守护进程故障认定时间
INST_ERROR_TIME = 20 #本地实例故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_OGUID = 45331 #守护系统唯一 OGUID 值
INST_INI = /home/max/dmdbms/data/PRIMARY/dm.ini #dm.ini 文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /home/max/dmdbms/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
sudo /home/max/dmdbms/script/root/dm_service_installer.sh -t dmserver -p PRIMARY -dm_ini /home/max/dmdbms/data/PRIMARY/dm.ini -m mount
sudo /home/max/dmdbms/script/root/dm_service_installer.sh -t dmwatcher -p Watcher -watcher_ini /home/max/dmdbms/data/PRIMARY/dmwatcher.ini
./dminit path=/home/max/dmdbms/data DB_NAME=SECONDARY INSTANCE_NAME=SECONDARY PAGE_SIZE=32 port_num=6094 SYSDBA_PWD='0X4c1a4d83' SYSAUDITOR_PWD='0X4c1a4d83'
## 这里是本机
scp -r /home/max/dmdbms/data/PRIMARY/bak/BACKUP_FILE /home/max/dmdbms/data/SECONDARY/bak/BACKUP_FILE
scp -r /opt/dmdbms/data/DAMENG/bak/BACKUP_FILE dmdba@192.168.1.2:/opt/dmdbms/data/DAMENG/bak
## 恢复数据库文件
/home/max/dmdbms/bin/dmrman CTLSTMT="RESTORE DATABASE '/home/max/dmdbms/data/SECONDARY/dm.ini' FROM BACKUPSET '/home/max/dmdbms/data/SECONDARY/bak/BACKUP_FILE'"
## 介质恢复,使其达到一致状态。
/home/max/dmdbms/bin/dmrman CTLSTMT="RECOVER DATABASE '/home/max/dmdbms/data/SECONDARY/dm.ini' FROM BACKUPSET '/home/max/dmdbms/data/SECONDARY/bak/BACKUP_FILE'"
## 恢复后更新 DB_MAGIC
/home/max/dmdbms/bin/dmrman CTLSTMT="RECOVER DATABASE '/home/max/dmdbms/data/SECONDARY/dm.ini' UPDATE DB_MAGIC"
ARCH_WAIT_APPLY = 0 #0:高性能 1:事务一致
[ARCHIVE_LOCAL]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /home/max/dmdbms/data/SECONDARY/arch #本地归档存放路径
ARCH_FILE_SIZE = 1024 #单个归档大小,单位 MB
ARCH_SPACE_LIMIT = 51200 #归档上限,单位 MB
[ARCHIVE_REALTIME1]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = PRIMARY #实时归档目标实例名
ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间
MAL_INI = 1 #打开 MAL 系统
ARCH_INI = 1 #打开归档配置
和主机几乎一样,只需要修改少部分地址即可
sudo /home/max/dmdbms/script/root/dm_service_installer.sh -t dmserver -p SECONDARY -dm_ini /home/max/dmdbms/data/SECONDARY/dm.ini -m mount
sudo /home/max/dmdbms/script/root/dm_service_installer.sh -t dmwatcher -p Watcher2 -watcher_ini /home/max/dmdbms/data/SECONDARY/dmwatcher.ini
vi /home/max/dmdbms/bin/dmmonitor.ini
MON_DW_CONFIRM = 1 #0:非确认(故障手切) 1:确认(故障自切)
MON_LOG_PATH = ../log #监视器日志文件存放路径
MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 512 #单个日志大小,单位 MB
MON_LOG_SPACE_LIMIT = 2048 #日志上限,单位 MB
[GRP1]
MON_INST_OGUID = 45331 #组 GRP1 的唯一 OGUID 值
MON_DW_IP = 192.168.40.128:6093 #IP 对应 MAL_HOST,PORT 对应 MAL_DW_PORT
MON_DW_IP = 192.168.40.128:6094
集群各节点的 bin 目录中,存放非确认监视器配置文件。
说明:在配置监视器时,一般配置好确认监视器后,建议再配置一个非确认监视器的配置文件,在主备发生切换时,可以通过前台的方式启动非确认监视器进行手动切换。非确认监视器是通过将监视器配置文件中 MON_DW_CONFIRM 参数值修改为 0 来实现。
vi /home/max/dmdbms/bin/dmmonitor_manual.ini
MON_DW_CONFIRM = 0 #0:非确认(故障手切) 1:确认(故障自切)
MON_LOG_PATH = ../log #监视器日志文件存放路径
MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 512 #单个日志大小,单位 MB
MON_LOG_SPACE_LIMIT = 2048 #日志上限,单位 MB
[GRP1]
MON_INST_OGUID = 45331 #组 GRP1 的唯一 OGUID 值
MON_DW_IP = 192.168.40.128:5193 #IP 对应 MAL_HOST,PORT 对应 MAL_DW_PORT
MON_DW_IP = 192.168.40.128:5194
非确认监视器无需注册服务。
sudo /home/max/dmdbms/script/root/dm_service_installer.sh -t dmmonitor -p Monitor -monitor_ini /home/max/dmdbms/bin/dmmonitor.ini
至此,已经部署完成
启动主机服务
./DmServicePRIMARY start
./disql SYSDBA/0X4c1a4d83@192.168.40.128:6093
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SP_SET_OGUID(45331);
ALTER DATABASE PRIMARY;
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
启动备机服务
./DmServiceSECONDARY start
./disql SYSDBA/0X4c1a4d83@192.168.40.128:6094
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SP_SET_OGUID(45331);
ALTER DATABASE STANDBY;
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
启动守护进程
./DmWatcherServiceWatcher start
./DmWatcherServiceWatcher2 start
启动监视器
##后台启动
./DmMonitorServiceMonitor start
##前台启动
./dmmonitor /opt/dmdbms/bin/dmmonitor.ini
##查看集群状态
tip
show
##登录非确认监视器
login
##查看满足切换条件的实例
choose switchover GRP1
##主备切换
switchover GRP1.SECONDARY
问题1:启动后发现两个节点都处于mount状态
原因:发现是两个节点的FLSN和CLSN不同步。
解决:手动重新备份后解决。
问题2:然后在一次调参后,启动发现:Monitor可以连接到SECONDARY节点,但是却接收不到任何内容。通过查阅~/dmdbms/log/dm_dmwatcher_SECONDARY_202507.log
,发现如下内容:
2025-07-16 01:11:24.589 [INFO] dmwatcher P0000026559 T0000000000000027230 Instance: 守护进程状态(STARTUP) 实例状态(OK) 实例名(PRIMARY) 模式(PRIMARY) 实例状态(MOUNT) 归档状态(INVALID) POCNT(1) FLSN(46026) CLSN(46
026) SLSN(46026) SSLSN(46026)
2025-07-16 01:11:24.909 [INFO] dmwatcher P0000026559 T0000000000000026564 dw2_tcp_conn_startup, oguid(45331) configured in dmwatcher.ini not equal with local dmserver's oguid(0)!
原因:在 dmwatcher.ini
配置的 OGUID = 45331
,但启动的 dmserver
实例中,并没有设置这个 OGUID。
解决:
## 进入 disql 连接SECONDARY:
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SP_SET_OGUID(45331);
ALTER DATABASE STANDBY;
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
发现问题解决了。
注1:如果VMware的Ubuntu虚拟机黑屏了但可以远程ssh到,可以输入下面命令重启图形界面
sudo systemctl restart gdm
注2:达梦数据库的主备同步系统 不能使用本地回环地址(loopback address) 127.0.0.1
作为 MAL 系统的 IP 地址。
注3:查看当前运行的dm进程
ps -ef | grep dm
文章
阅读量
获赞