注册
达梦数据库多表连接
专栏/培训园地/ 文章详情 /

达梦数据库多表连接

无所谓先生 2024/01/04 1584 0 0
摘要

1基本概念

嵌套循环:依靠两层嵌套循环(分别为外层循环和内存循环)来得到连接结果集的表连接方法。即外层循环对应的驱动结果集有多少条记录,遍历被驱动表的内层循环就要做多少次。在达梦中的标识符为
HASH连接:同样是选择两个数据结果集⽐较⼩的那个作为驱动表,在连接列上创建⼀个摆放在内存⾥的hash表,然后使⽤唯⼀性的hash函数来指定每⼀⾏在hash表⾥的存放位置。然后数据库会扫描⼤的那个数据集,探测hash表,找到匹配的⾏。
排序合并连接:通过连接列先分别排序后, 再通过合并操作来得到最后返回的结果集。
其中排序合并连接大部分场景下都能被上述两种替换掉,下面就不针对这种连接方式做分析。

2测试过程

2.1创建测试数据
模拟进销存的业务创建以下表单:c_store 店仓表、m_product商品表、m_retail零售头表、m_retailitem零售明细表、m_transferitem调拨明细表。
说明:零售表头记录了店仓表的ID;零售明细表和调拨明细表记录了商品表ID
数据条目数如下:
图片.png

2.2模拟小表关联大表
执行以下SQL:
select *
from c_Store c,m_retail m
where c.id = m.c_store_id

--未创建任何索引时的执行计划
图片.png
--基于上述情况,改写SQL,将where条件改为 c.id>m.c_store_id
图片.png
--SQL恢复成等值连接,并在m_retail表单的c_Store_id字段上创建了索引后的执行计划
(创建索引语句:create index ind_retaill_001 on m_retail(c_Store_id);)
图片.png
根据上述测试可以发现:
①小表连接大表时,小表都会作为驱动表;
②等值连接时:在被驱动表上的关联字段上无适合索引时会走HASH JOIN,有适合索引时则会走NESTED LOOP。
③不等值连接时:有无索引都会走NESTED LOOP。
④NESTED LOOP时对被驱动表的扫描次数为小表的条目数,扫描的效率由被驱动表上的索引决定。因为是拿关联条件去扫描,所以非等值连接不受影响。

2.3模拟大表连接大表
执行以下SQL:
select *
from m_transferitem m,M_RETAILitem a
where m.m_product_id = a.m_product_id
and m.OWNERID in (895);--单据创建用户ID为895

不创建任何索引,执行计划如下:
图片.png
在m_retailitem表的m_product_id上创建索引,执行计划如下:
图片.png

创建索引create index idx_transferitem_ownerid on m_transferitem(OWNERID)后,执行计划如下(OWNERID具有很好的过滤性,OWNERID=895的有4000条数据):
图片.png

这里需要注意执行计划中有一个ACTRL操作符节点,它说明优化器为这一条SQL语句生成了备用计划。ACTRL是控制备用计划转换的操作符,其上面一层NEST LOOP INDEX JOIN2为默认的主计划,再上面一层HASH2 INNER JOIN则为备用计划。ACTRL操作符计算下层孩子节点的代价,决定采用默认主计划还是备用计划。这就涉及到另外一个概念:数据倾斜,代价的计算是通过正确的统计信息才能保证合理,

也可以强制走HASH JOIN,SQL和对应的如下图:
select /+ use_hash(m,a)/ *
from m_transferitem m,M_RETAILitem a
where m.m_product_id = a.m_product_id
and m.OWNERID in (895);
图片.png

根据上述测试可以发现:
①大表连接大表时,如果其中一张表上有好的过滤条件且对应的索引来缩小结果集,是可以当做小表来处理,作为驱动表去遍历大表。不过达梦会根据代价去选择进行哪种连接方式。
②HASH JOIN连接中是用不到被驱动表上关联条件字段的索引的(不是过滤条件)

评论
后发表回复

作者

文章

阅读量

获赞

扫一扫
联系客服