达梦数据库脑裂技术防护

前言

本篇博客主要讲一些数据库集群的设计方面，应对于各种不同的环境所作出的措施

脑裂 (split-brain) 是一种故障状态，通常出现在分布式系统或集群环境中。在这种状态下，集群中的多个节点失去了彼此之间的通信连接，但它们仍然可以独立地访问和操作共享资源（如数据库或文件系统）。由于缺乏协调，这些节点可能会执行冲突的操作，从而导致数据不一致、数据丢失或其他严重问题。

脑裂的情况一般都是因为心跳断开导致，然后各个节点各自对共享的数据进行操作导致，由图：

根据脑裂的触发条件，可通过以下方式进行防止：

HA 服务脑裂主要是主机、备机会同时向共享存储写入数据，造成严重的数据错乱，DM预防手段如下:

可能存在脑裂场景：

应对方式：

双节点：
当内网网卡故障时，系统会执行故障处理，保留节点号小的节点（DM2），节点号大的节点会自杀并踢出集群（DM1），当网络回复时，该服务仍然处于停止状态（DM1），需要人工进行恢复；
三节点：
当内网网卡故障时，系统会执行故障处理，DM1 通过网络心跳连接不到其他服务器的时候，会自杀并被踢出集群，当网络回复时，该服务仍然处于停止状态（DM1），需要人工进行恢复；