智能索引是一种粗粒度索引,数据存储时每65536 行数据打成一个Data
Cell(简称DC)包,
每个数据包在加载数据时自动建立智能索引,
包含统计信息,
在数据查询时不需要解包就能得到统计值,可进一步降低I/O,对复杂查询的
优化效果明显。如下图所示,左侧的“SmartIndex
of
Col
1”即在第一列数据
上,以各数据包(DC)为单位建立的智能索引。
图 3-3 智能索引示意图
1)表中的所有列自动建立智能索引,不需用户手工建立和维护;
2)智能索引本身占空间少(1%左右),不会造成数据膨胀;
3)
智能索引建立速度快,
智能索引基于数据包建立,
不受已存在数据包的
影响。
与传统数据库索引技术相比,智能索引建立在数据包上(粗粒度索引),
并且每个字段均自动建有索引,
而传统索引建立在每行数据上
(细粒度索引)
,
因此访问智能索引要比访问传统索引需要更少的I/O。同时,智能索引所占空
间大约是数据的百分之一,而传统数据库索引则要占到数据的20~ 50%。
GBase 8a MPP Cluster 技术白皮书
- 10 -
南大通用数据技术股份有限公司