注册
DM8数据守护集群的搭建
培训园地/ 文章详情 /

DM8数据守护集群的搭建

l 2023/04/06 1332 1 0

一.搭建规划

规划.png

二.安装操作系统,配置IP

操作系统安装过程略
[root@localhost network-scripts]# cat ifcfg-ens33
TYPE=Ethernet
BOOTPROTO=static
DEFROUTE=yes
NAME=ens33
DEVICE=ens33
ONBOOT=yes
IPADDR=192.168.212.130
NETMASK=255.255.255.0

[root@localhost network-scripts]# cat ifcfg-ens36
TYPE=Ethernet
BOOTPROTO=static
DEFROUTE=yes
NAME=ens33
DEVICE=ens33
ONBOOT=yes
IPADDR=192.168.212.132
NETMASK=255.255.255.0

三.安装第一台数据库(A机器)

用命令行文本的安装方式,数据库软件安装略(可见往期数据库安装)

1.配置A机器,初始化实例并备份数据

[dmdba@localhost bin]$ /dm/bin/dminit PATH=/dm/data/ INSTANCE_NAME=GRP1_RT_01 PAGE_SIZE=32 EXTENT_SIZE=32 LOG_SIZE=2048
initdb V8
db version: 0x7000c
file dm.key not found, use default license!
License will expire on 2023-08-30
Normal of FAST
Normal of DEFAULT
Normal of RECYCLE
Normal of KEEP
Normal of ROLL

 log file path: /dm/data/DAMENG/DAMENG01.log


 log file path: /dm/data/DAMENG/DAMENG02.log

write to dir [/dm/data/DAMENG].
create dm database success. 2022-11-10 16:22:53

2.启动服务

[dmdba@localhost data]$ /dm/bin/dmserver /dm/data/DAMENG/dm.ini
由这个指令就可以看到它的db_name默认的是DAMENG,这是一个前台启动命令


(主备库应该是db_name是一样的,INSTANCE_NAME是不一样的。我猜的话)

file dm.key not found, use default license!
version info: develop
DM Database Server 64 V8 03134283904-20220830-18321-20005 startup...

3.开启归档

SQL> ALTER DATABASE MOUNT;
SQL> ALTER DATABASE ARCHIVELOG;
SQL> ALTER DATABASE ADD ARCHIVELOG 'DEST=/dm/data/DAMENG/arch, TYPE=LOCAL, FILE_SIZE=1024, SPACE_LIMIT=51200';
SQL> ALTER DATABASE OPEN;

4.备份数据
SQL> BACKUP DATABASE BACKUPSET '/dm/data/DAMENG/bak/BACKUP_FILE';

5.修改 dm.ini

SELECT * FROM V$DM_INI
WHERE
        "V$DM_INI".PARA_NAME IN ('PORT_NUM', 'INSTANCE_NAME', 'DW_INACTIVE_INTERVAL', 'ALTER_MODE_STATUS', 'ENABLE_OFFLINE_TS', 'MAL_INI', 'ARCH_INI', 'RLOG_SEND_APPLY_MON');
        

在 DW_P 机器上配置主库的实例名为 GRP1_RT_01,dm.ini 参数修改如下:

#实例名,建议使用―组名_守护环境_序号‖的命名方式,总长度不能超过 16
INSTANCE_NAME = GRP1_RT_01 
PORT_NUM = 5236 #数据库实例监听端口
DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间
ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间
MAL_INI = 1 #打开 MAL 系统
ARCH_INI = 1 #打开归档配置
RLOG_SEND_APPLY_MON = 64 #统计最近 64 次的日志发送信息

SQL> SP_SET_PARA_VALUE (2,'PORT_NUM',5236);
SQL> SP_SET_PARA_VALUE (2,'DW_INACTIVE_INTERVAL',60);
SQL> SP_SET_PARA_VALUE (2,'ALTER_MODE_STATUS',0);
SQL> SP_SET_PARA_VALUE (2,'ENABLE_OFFLINE_TS',2);
SQL> SP_SET_PARA_VALUE (2,'MAL_INI',1);
SQL> SP_SET_PARA_VALUE (2,'RLOG_SEND_APPLY_MON',64);

6.关闭前台实例服务
SQL> shutdown immediate;

ps -ef |grep dbserver 没有进程了

7.修改配置文件

7.1.修改 dmarch.ini 配置本地归档和实时归档
在/dm/data/DAMENG 下编辑 dmarch.ini文件


[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /dm/data/DAMENG/arch #本地归档文件存放路径
ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 0 #单位 Mb,0 表示无限制,范围 1024~2147483647M
[ARCHIVE_REALTIME] #加下面这一块
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = GRP1_RT_02 #实时归档目标实例名

7.2.配置 dmmal.ini

配置 MAL 系统,各主备库的 dmmal.ini 配置必须完全一致,MAL_HOST 使用内部网
络 IP,MAL_PORT 与 dm.ini 中 PORT_NUM 使用不同的端口值,MAL_DW_PORT 是各实例
对应的守护进程之间,以及守护进程和监视器之间的通信端口,配置如下:

vi /dm/data/DAMENG/dmmal.ini

MAL_CHECK_INTERVAL         = 10  #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL     = 10  #判定 MAL 链路断开的时间
MAL_BUF_SIZE               = 512  #单个 MAL 缓存大小,单位 MB
MAL_SYS_BUF_SIZE           = 2048  #MAL 总大小限制,单位 MB
MAL_COMPRESS_LEVEL         = 0  #MAL 消息压缩等级,0 表示不压缩

[MAL_INST1]
MAL_INST_NAME            = GRP1_RT_01  #实例名,和 dm.ini 的 INSTANCE_NAME 一致
MAL_HOST                 = 192.168.212.132  #MAL 系统监听 TCP 连接的 IP 地址
MAL_PORT                 = 5336  #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST            = 192.168.212.130  #实例的对外服务 IP 地址
MAL_INST_PORT            = 5236  #实例对外服务端口,和 dm.ini 的 PORT_NUM 一致
MAL_DW_PORT              = 5436  #实例对应的守护进程监听 TCP 连接的端口
MAL_INST_DW_PORT         = 5536  #实例监听守护进程 TCP 连接的端口

[MAL_INST2]
MAL_INST_NAME            = GRP1_RT_02
MAL_HOST                 = 192.168.212.142
MAL_PORT                 = 5336
MAL_INST_HOST            = 192.168.212.140
MAL_INST_PORT            = 5236
MAL_DW_PORT              = 5436
MAL_INST_DW_PORT         = 5536

7.3.配置 dmwatcher.ini
修改 dmwatcher.ini 配置守护进程,配置为全局守护类型,使用自动切换模式。

 vi /dm/data/DAMENG/dmwatcher.ini
 
[GRP1]
DW_TYPE                  = GLOBAL  #全局守护类型
DW_MODE                  = AUTO #MANUAL:故障手切 AUTO:故障自切 这个地方改成auto
DW_ERROR_TIME            = 20  #远程守护进程故障认定时间
INST_ERROR_TIME          = 20  #本地实例故障认定时间
INST_RECOVER_TIME        = 60  #主库守护进程启动恢复的间隔时间
INST_OGUID               = 45331  #守护系统唯一 OGUID 值
INST_INI                 = /dm/data/DAMENG/dm.ini  #dm.ini 文件路径
INST_AUTO_RESTART        = 1  #打开实例的自动启动功能
INST_STARTUP_CMD         = /dm/bin/dmserver  #命令行方式启动
RLOG_SEND_THRESHOLD      = 0  #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD     = 0  #指定备库重演日志的时间阈值,默认关闭


8.以 Mount 方式启动主库
cd /dm/bin

./dmserver /dm/data/DAMENG/dm.ini mount

9.设置 OGUID
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SQL>sp_set_oguid(45331);
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);

10.修改数据库模式
登录主库修改数据库为 Primary 模式
SQL>alter database primary;

四.安装第二台数据库(B机器)

1.给B机器配置IP,先给备库装上数据库软件(命令行文本安装,略,可见往期数据库安装)

2.初始化数据库

[dmdba@~]$ /dm/bin/dminit PATH=/dm/data/ INSTANCE_NAME=GRP1_RT_02 PAGE_SIZE=32 EXTENT_SIZE=32 LOG_SIZE=2048

3.恢复数据库

对主库进行联机备份操作
SQL> BACKUP DATABASE BACKUPSET '/dm/data/BACKUP_FILE'; (之前已经做了)

传送备份
scp -r BACKUP_FILE dmdba@192.168.212.140:/tmp

cp -r BACKUP_FILE /dm/data/DAMENG/bak/


./dmrman CTLSTMT="RESTORE DATABASE '/dm/data/DAMENG/dm.ini' FROM BACKUPSET '/dm/data/DAMENG/bak/BACKUP_FILE'"
./dmrman CTLSTMT="RECOVER DATABASE '/dm/data/DAMENG/dm.ini' FROM BACKUPSET '/dm/data/DAMENG/bak/BACKUP_FILE'"
./dmrman CTLSTMT="RECOVER DATABASE '/dm/data/DAMENG/dm.ini' UPDATE DB_MAGIC"


[dmdba@localhost bin]$ ./dmrman CTLSTMT="RESTORE DATABASE '/dm/data/DAMENG/dm.ini' FROM BACKUPSET '/dm/data/DAMENG/bak/BACKUP_FILE'"
dmrman V8
RESTORE DATABASE '/dm/data/DAMENG/dm.ini' FROM BACKUPSET '/dm/data/DAMENG/bak/BACKUP_FILE'
file dm.key not found, use default license!
Normal of FAST
Normal of DEFAULT
Normal of RECYCLE
Normal of KEEP
Normal of ROLL
[Percent:100.00%][Speed:0.00M/s][Cost:00:00:02][Remaining:00:00:00]                                 
restore successfully.
time used: 00:00:02.665


[dmdba@localhost bin]$ ./dmrman CTLSTMT="RECOVER DATABASE '/dm/data/DAMENG/dm.ini' FROM BACKUPSET '/dm/data/DAMENG/bak/BACKUP_FILE'"
dmrman V8
RECOVER DATABASE '/dm/data/DAMENG/dm.ini' FROM BACKUPSET '/dm/data/DAMENG/bak/BACKUP_FILE'
file dm.key not found, use default license!
Database mode = 0, oguid = 0
Normal of FAST
Normal of DEFAULT
Normal of RECYCLE
Normal of KEEP
Normal of ROLL
EP[0]'s cur_lsn[39532], file_lsn[39532]
[Percent:100.00%][Speed:0.00PKG/s][Cost:00:00:00][Remaining:00:00:00]                               
recover successfully!
time used: 00:00:02.501

[dmdba@localhost bin]$ ./dmrman CTLSTMT="RECOVER DATABASE '/dm/data/DAMENG/dm.ini' UPDATE DB_MAGIC"
dmrman V8
RECOVER DATABASE '/dm/data/DAMENG/dm.ini' UPDATE DB_MAGIC
file dm.key not found, use default license!
Database mode = 0, oguid = 0
Normal of FAST
Normal of DEFAULT
Normal of RECYCLE
Normal of KEEP
Normal of ROLL
EP[0]'s cur_lsn[41020], file_lsn[41020]
recover successfully!
time used: 00:00:01.015

看这个样子恢复成功

4.修改配置文件

4.1.替换 dmarch.ini

[dmdba@~]$ vi /dm/data/DAMENG/dmarch.ini

ARCH_WAIT_APPLY            = 0  #0:高性能(故障手切) 1:事务一致(故障自切)

[ARCHIVE_LOCAL]
ARCH_TYPE                = LOCAL  #本地归档类型
ARCH_DEST                = /dm/data/DAMENG/arch/  #本地归档存放路径
ARCH_FILE_SIZE           = 1024  #单个归档大小,单位 MB
ARCH_SPACE_LIMIT         = 51200  #归档上限,单位 MB

[ARCHIVE_REALTIME1]
ARCH_TYPE                = REALTIME  #实时归档类型
ARCH_DEST                = GRP1_RT_01  #实时归档目标实例名

4.2.配置 dm.ini、dmmal.ini 和 dmwatcher.ini

在 B 机器上配置备库的实例名为 GRP1_RT_02,dm.ini 参数修改如下:

INSTANCE_NAME  = GRP1_RT_02
PORT_NUM = 5236                               #数据库实例监听端口
DW_INACTIVE_INTERVAL = 60              #接收守护进程消息超时时间
ALTER_MODE_STATUS = 0                     #不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS  = 2                      #不允许备库 OFFLINE 表空间
MAL_INI = 1                                           #打开 MAL 系统
ARCH_INI = 1                                         #打开归档配置
RLOG_SEND_APPLY_MON = 64             #统计最近 64 次的日志重演信息

配置 dmmal.ini 和 dmwatcher.ini

B 机器里 dmmal.ini、dmwatcher.ini 与 A 机器 GRP1_RT_01 的 dmmal.ini、dmwatcher.ini 相同,参照 A 机器 dmmal.ini、dmwatcher.ini 文件进行配置。

去A机器复制过来

vi /dm/data/DAMENG/dmmal.ini

MAL_CHECK_INTERVAL         = 10  #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL     = 10  #判定 MAL 链路断开的时间
MAL_BUF_SIZE               = 512  #单个 MAL 缓存大小,单位 MB
MAL_SYS_BUF_SIZE           = 2048  #MAL 总大小限制,单位 MB
MAL_COMPRESS_LEVEL         = 0  #MAL 消息压缩等级,0 表示不压缩

[MAL_INST1]
MAL_INST_NAME            = GRP1_RT_01  #实例名,和 dm.ini 的 INSTANCE_NAME 一致
MAL_HOST                 = 192.168.212.132  #MAL 系统监听 TCP 连接的 IP 地址
MAL_PORT                 = 5336  #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST            = 192.168.212.130  #实例的对外服务 IP 地址
MAL_INST_PORT            = 5236  #实例对外服务端口,和 dm.ini 的 PORT_NUM 一致
MAL_DW_PORT              = 5436  #实例对应的守护进程监听 TCP 连接的端口
MAL_INST_DW_PORT         = 5536  #实例监听守护进程 TCP 连接的端口

[MAL_INST2]
MAL_INST_NAME            = GRP1_RT_02
MAL_HOST                 = 192.168.212.133  #这个ip改了
MAL_PORT                 = 5336
MAL_INST_HOST            = 192.168.212.140
MAL_INST_PORT            = 5236
MAL_DW_PORT              = 5436
MAL_INST_DW_PORT         = 5536


vi /dm/data/DAMENG/dmwatcher.ini
 
[GRP1]
DW_TYPE                  = GLOBAL  #全局守护类型
DW_MODE                  = AUTO #MANUAL:故障手切 AUTO:故障自切
DW_ERROR_TIME            = 20  #远程守护进程故障认定时间
INST_ERROR_TIME          = 20  #本地实例故障认定时间
INST_RECOVER_TIME        = 60  #主库守护进程启动恢复的间隔时间
INST_OGUID               = 45331  #守护系统唯一 OGUID 值
INST_INI                 = /dm/data/DAMENG/dm.ini  #dm.ini 文件路径
INST_AUTO_RESTART        = 1  #打开实例的自动启动功能
INST_STARTUP_CMD         = /dm/bin/dmserver  #命令行方式启动
RLOG_SEND_THRESHOLD      = 0  #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD     = 0  #指定备库重演日志的时间阈值,默认关闭

5.启动备库

以 Mount 方式启动备库
./dmserver /dm/data/DAMENG/dm.ini mount


6.设置 OGUID

启动命令行工具 DIsql,登录备库设置 OGUID 值为 45331

SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);  #让这个参数可以手动修改
SQL>sp_set_oguid(45331);
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);

select status$,mode$ from v$instance; 

系统通过 OGUID 值确定一个守护进程组,由用户保证 OGUID 值的唯一性,并
确保数据守护系统中,数据库、守护进程和监视器配置相同的 OGUID 值。

7.修改数据库模式

启动命令行工具 DIsql,登录备库修改数据库为 Standby 模式。
如果当前数据库不是 Normal 模式,需要先修改 dm.ini 中 ALTER_MODE_STATUS 值
为 1,允许修改数据库模式,修改 Standby 模式成功后再改回为 0。如果是 Normal 模式,
请忽略下面的第 1 步和第 3 步。

SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1); ----第 1 步
SQL>alter database standby; ----第 2 步 
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0); ----第 3 步


五.配置监视器

由于主库和实时备库的守护进程配置为自动切换模式,因此这里选择配置确认监视器。
和普通监视器相比,确认监视器除了相同的命令支持外,在主库发生故障时,能够自动通知
实时备库接管为新的主库,具有自动故障处理的功能。

手动切换:集群各节点的 bin 目录中,存放非确认监视器配置文件。
自动切换:在确认监视器上(非集群节点),存放确认监视器配置文件,并注册后台自启服务。

修改 dmmonitor.ini 配置确认监视器,其中 MON_DW_IP 中的 IP 和 PORT 和
dmmal.ini 中的 MAL_HOST 和 MAL_DW_PORT 配置项保持一致。


1. 创建 dmmonitor.ini

vi /dm/bin/dmmonitor.ini

[dmdba@~]$ vi /dm/bin/dmmonitor.ini

MON_DW_CONFIRM             = 0  #0:非确认(故障手切) 1:确认(故障自切)
MON_LOG_PATH               =  /dm/data/log #监视器日志文件存放路径
MON_LOG_INTERVAL           = 60  #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE          = 32  #单个日志大小,单位 MB
MON_LOG_SPACE_LIMIT        = 2048  #日志上限,单位 MB

[GRP1]
MON_INST_OGUID           = 45331  #组 GRP1 的唯一 OGUID 值
MON_DW_IP                = 192.168.212.132:5436  #IP 对应 MAL_HOST,PORT 对应 MAL_DW_PORT
MON_DW_IP                = 192.168.212.133:5436


2.启动守护进程
启动各个主备库上的守护进程:(A,B库都要启动)
./dmwatcher /dm/data/DAMENG/dmwatcher.ini

[dmdba@localhost bin]$ ./dmwatcher /dm/data/DAMENG/dmwatcher.ini
DMWATCHER[4.0] V8
DMWATCHER[4.0] IS READY

两边都启动成功了

守护进程启动后,进入 Startup 状态,此时实例都处于 Mount 状态。守护进程开始
广播自身和其监控实例的状态信息,结合自身信息和远程守护进程的广播信息,守护进程将
本地实例 Open,并切换为 Open 状态

这个操作并没有改变数据库的状态,还是mount状态,是否需要手动起也没说呀

SQL> select status$ from v$instance;

行号     STATUS$
---------- -------
1          MOUNT

把主备的防火墙都关掉

systemctl status firewalld
systemctl stop firewalld
systemctl disable firewalld

关了防火墙之后,果然open了


3.启动监视器(在监视器的机器上)

./dmmonitor /dm/data/dmmonitor.ini

[dmdba@localhost /]$ cd /dm/bin
[dmdba@localhost bin]$ ./dmmonitor /dm/bin/dmmonitor.ini
[monitor]         2022-11-11 20:01:53: DMMONITOR[4.0] V8
[monitor]         2022-11-11 20:01:54: DMMONITOR[4.0] IS READY.


搭完了怎么样去看这个主备集群是不是正常的
通过db_monitor去看

./dmmonitor /dm/bin/dmmonitor.ini  之后用show命令

show   
2022-11-11 22:00:13 
#================================================================================#
GROUP            OGUID       MON_CONFIRM     MODE            MPP_FLAG  
GRP1             45331       FALSE           MANUAL          FALSE     


<<DATABASE GLOBAL INFO:>>
DW_IP               MAL_DW_PORT  WTIME                WTYPE     WCTLSTAT  WSTATUS        INAME            INST_OK   N_EP  N_OK  ISTATUS     IMODE     DSC_STATUS     RTYPE     RSTAT    
192.168.212.132     5436         2022-11-11 14:00:13  GLOBAL    VALID     OPEN           GRP1_RT_01       OK        1     1     OPEN        PRIMARY   DSC_OPEN       REALTIME  VALID    

EP INFO:
INST_IP             INST_PORT  INST_OK   INAME            ISTATUS     IMODE     DSC_SEQNO  DSC_CTL_NODE RTYPE     RSTAT    FSEQ            FLSN            CSEQ            CLSN            DW_STAT_FLAG          
192.168.212.130     5236       OK        GRP1_RT_01       OPEN        PRIMARY   0          0            REALTIME  VALID    5377            44157           5377            44157           NONE                  

<<DATABASE GLOBAL INFO:>>
DW_IP               MAL_DW_PORT  WTIME                WTYPE     WCTLSTAT  WSTATUS        INAME            INST_OK   N_EP  N_OK  ISTATUS     IMODE     DSC_STATUS     RTYPE     RSTAT    
192.168.212.133     5436         2022-11-11 14:00:13  GLOBAL    VALID     OPEN           GRP1_RT_02       OK        1     1     OPEN        STANDBY   DSC_OPEN       REALTIME  VALID    

EP INFO:
INST_IP             INST_PORT  INST_OK   INAME            ISTATUS     IMODE     DSC_SEQNO  DSC_CTL_NODE RTYPE     RSTAT    FSEQ            FLSN            CSEQ            CLSN            DW_STAT_FLAG          
192.168.212.140     5236       OK        GRP1_RT_02       OPEN        STANDBY   0          0            REALTIME  VALID    4806            44156           4806            44156           NONE                  

DATABASE(GRP1_RT_02) APPLY INFO FROM (GRP1_RT_01), REDOS_PARALLEL_NUM (1):
DSC_SEQNO[0], (RSEQ, SSEQ, KSEQ)[5376, 5376, 5377], (RLSN, SLSN, KLSN)[44156, 44156, 44157], N_TSK[0], TSK_MEM_USE[512] 
REDO_LSN_ARR: (44156)


show version(查看版本信息)
DMMONITOR[4.0] V8

show global info(显示所有组的全局信息)
show i[nterval] n  (show i 10 每隔10s显示所有组信息)

评论
后发表回复

作者

文章

阅读量

获赞

扫一扫
联系客服