1基本概念

嵌套循环：依靠两层嵌套循环（分别为外层循环和内存循环）来得到连接结果集的表连接方法。即外层循环对应的驱动结果集有多少条记录，遍历被驱动表的内层循环就要做多少次。在达梦中的标识符为
HASH连接：同样是选择两个数据结果集⽐较⼩的那个作为驱动表，在连接列上创建⼀个摆放在内存⾥的hash表，然后使⽤唯⼀性的hash函数来指定每⼀⾏在hash表⾥的存放位置。然后数据库会扫描⼤的那个数据集，探测hash表，找到匹配的⾏。
排序合并连接：通过连接列先分别排序后, 再通过合并操作来得到最后返回的结果集。
其中排序合并连接大部分场景下都能被上述两种替换掉，下面就不针对这种连接方式做分析。

2测试过程

2.1创建测试数据
模拟进销存的业务创建以下表单：c_store 店仓表、m_product商品表、m_retail零售头表、m_retailitem零售明细表、m_transferitem调拨明细表。
说明：零售表头记录了店仓表的ID；零售明细表和调拨明细表记录了商品表ID
数据条目数如下：
图片.png

2.2模拟小表关联大表
执行以下SQL:
select *
from c_Store c,m_retail m
where c.id = m.c_store_id

--未创建任何索引时的执行计划
图片.png
--基于上述情况，改写SQL,将where条件改为 c.id>m.c_store_id

--SQL恢复成等值连接，并在m_retail表单的c_Store_id字段上创建了索引后的执行计划
（创建索引语句：create index ind_retaill_001 on m_retail(c_Store_id);）

根据上述测试可以发现：
①小表连接大表时，小表都会作为驱动表；
②等值连接时：在被驱动表上的关联字段上无适合索引时会走HASH JOIN，有适合索引时则会走NESTED LOOP。
③不等值连接时：有无索引都会走NESTED LOOP。
④NESTED LOOP时对被驱动表的扫描次数为小表的条目数，扫描的效率由被驱动表上的索引决定。因为是拿关联条件去扫描，所以非等值连接不受影响。

2.3模拟大表连接大表
执行以下SQL：
select *
from m_transferitem m,M_RETAILitem a
where m.m_product_id = a.m_product_id
and m.OWNERID in (895);--单据创建用户ID为895

不创建任何索引，执行计划如下：
图片.png
在m_retailitem表的m_product_id上创建索引，执行计划如下：

创建索引create index idx_transferitem_ownerid on m_transferitem(OWNERID)后，执行计划如下（OWNERID具有很好的过滤性，OWNERID=895的有4000条数据）：
图片.png

这里需要注意执行计划中有一个ACTRL操作符节点，它说明优化器为这一条SQL语句生成了备用计划。ACTRL是控制备用计划转换的操作符，其上面一层NEST LOOP INDEX JOIN2为默认的主计划，再上面一层HASH2 INNER JOIN则为备用计划。ACTRL操作符计算下层孩子节点的代价，决定采用默认主计划还是备用计划。这就涉及到另外一个概念：数据倾斜，代价的计算是通过正确的统计信息才能保证合理，

也可以强制走HASH JOIN，SQL和对应的如下图：
select /+ use_hash(m,a)/ *
from m_transferitem m,M_RETAILitem a
where m.m_product_id = a.m_product_id
and m.OWNERID in (895);
图片.png

根据上述测试可以发现：
①大表连接大表时，如果其中一张表上有好的过滤条件且对应的索引来缩小结果集，是可以当做小表来处理，作为驱动表去遍历大表。不过达梦会根据代价去选择进行哪种连接方式。
②HASH JOIN连接中是用不到被驱动表上关联条件字段的索引的（不是过滤条件）

达梦数据库多表连接

1基本概念

2测试过程

作者