管理堆表

17.1 什么是堆表

普通表都是以B树形式存放的,ROWID都是逻辑的ROWID,即从1一直增长下去。在并发情况下,每次插入过程中都需要逻辑生成ROWID,这样影响了插入数据的效率;对于每一条数据都需要存储ROWID值,也会花费较大的存储空间。堆表就是基于上述两个理由而提出的。

简单地说,堆表是指采用了物理ROWID形式的表,即使用文件号、页号和页内偏移而得到ROWID值,这样就不需要存储ROWID值,可以节省空间。逻辑ROWID在插入或修改过程中,为了确保ROWID的唯一性,需要依次累加而得到值,这样就影响了效率,而堆表只需根据自己的文件号、页号和页内偏移就可以得到ROWID,提高了效率。

普通表都是以B树形式而存储在物理磁盘上,而堆表则采用一种“扁平B树”方式存储,结构如下图所示。

堆表存储方式

图17.1 堆表存储方式

采用了物理ROWID形式的堆表,DM服务器内部对聚集索引进行了调整,没有采用传统B树结构,取而代之的是“扁平B树”,数据页都是通过链表形式存储。为支持并发插入,扁平B树可以支持最多128个数据页链表(最多64个并发分支和最多64个非并发分支),在B树的控制页中记录了所有链表的首、尾页地址。对于非并发分支,如果分支数有多个,即存在多个链表,则不同的用户登录系统之后,会依据其事务ID号,随机选择一条链表来对堆表进行插入操作。对于并发分支,则不同用户会选择不同的分支来进行插入,如果存在多个用户选择了同一条分支的情况,才需要等待其他用户插入结束并释放锁之后才能进行插入。在并发情况下,不同用户可以在不同的链表上进行插入,效率得到较大提升。

17.2 创建堆表

堆表的创建有两种方式,一种是采用在配置文件dm.ini中设置参数,一种是在建表语句中显式指定堆表选项。

  1. INI参数方式

用户可以在配置文件中,添加LIST_TABLE参数:

  1. 如果LIST_TABLE = 1,则在未显式指定表是否为堆表或非堆表时,默认情况下创建的表为堆表;
  2. 如果LIST_TABLE = 0,则在未显式指定表是否为堆表或非堆表时,默认情况下创建的表为普通表形式。
  1. SQL语句显示指定

不管参数LIST_TABLE设置为何值,创建表时可以在STORAGE选项中指定需要创建的表形式, 与堆表创建形式相关的关键字有三个,分别是NOBRANCH、BRANCH、CLUSTERBTR。详细语法形式参见《DM8_SQL语言使用手册》。

  1. NOBRANCH:如果指定为NOBRANCH,则创建的表为堆表,并发分支个数为0,非并发分支个数为1;
  2. BRANCH(n,m):如果为该形式,则创建的表为堆表,并发分支个数为n,非并发个数为m;
  3. BRANCH n:指定创建的表为堆表,并发分支个数为n,非并发分支个数为0;
  4. CLUSTERBTR:创建的表为非堆表,即普通B树表。

如下例创建的LIST_TABLE表有并发分支2个,非并发分支4个。

CREATE TABLE LIST_TABLE(C1 INT) STORAGE(BRANCH (2,4));

17.3 堆表的限制

堆表由于其自身的特性,与普通表相比,也为自己增添了一些限制。堆表不支持以下功能:

  1. 聚集索引

堆表采用了物理ROWID,即通过文件号、页号和页内偏移直接生成该值。这样如果我们知道了ROWID值,也就知道文件号、页号和页内偏移这些变量,就可以直接定位到某条记录,所以没有必要再为堆表创建聚集索引了。在创建堆表时,系统会默认创建聚集索引,该索引只是一个根页信息。显式建立聚集索引是不允许的,如果用户需要借助聚集索引主键对数据进行排序则不推荐使用堆表。

  1. 列存储

由于列存储采用了不同方式对表进行物理存储, DM服务器暂时不支持堆表的列存储。

17.4 维护堆表

堆表在进行数据扫描过程中,有着其先天的优势。如果知道了数据记录的ROWID,则直接可以对ROWID进行解码,得到该记录的文件号、页号和页内偏移,也就得到了该记录。所以建议在经常查询的列上建立二级索引,这样在进行操作中,先通过二级索引找到记录ROWID,就可以直接找到数据,效率有较大提高。

堆表虽然支持表的ALTER操作,但是建议轻易不要进行此类操作。对表进行ALTER操作,数据记录的ROWID有可能发生改变,这样每次进行ALTER操作,都可能进行索引的重建,需要花费较多的时间。

达梦服务器支持对堆表的备份与还原操作。还原数据时,B树数据和二级索引可以同时被还原。

17.5 查看有关堆表的信息

可以通过系统过程SP_TABLEDEF(‘SCHEMA_NAME’,’TABLE_NAME’)查看堆表的定义信息,该函数的详细信息可参考 《DM8_SQL语言使用手册》。

微信扫码
分享文档
扫一扫
联系客服