返回首页

gbase数据、南大通用产品文档:GBase8ahash 分布列注意事项

更新日期:2024年09月11日


Hash 列字段在使用过程中禁止加类似LTRIM 等函数处理操作,这样做会破
坏hash 分布,必须去掉,由外部保证字段数据的正确性。
例如:字段col1 在GROUP BY、INSERT INTO SELECT 投影列中对col1 加
的RTRIM、LTRIM 破坏了hash 分布,必须去掉。

GROUP BY 语句如果含有hash 列,将hash 列放在最前面。

多个JOIN 列如果有hash 列JOIN 的,将hash 列JOIN 放到最前面。

高效透明压缩技术能够按照数据类型和数据分布规律自动选择最优压缩算
法,尽可能减少数据所占的存储空间,降低查询的 I/O 消耗,提升查询性能。
并设置了库级,表级,列级压缩选项,灵活平衡性能与压缩比的关系,而且压
缩与解压缩过程对用户是透明的。
从 I/O 资源消耗节约的角度来看,对 I/O 是主要瓶颈的分析系统而言,
相较于传统的行式数据库,高效透明压缩技术可以带来约一个数量级的性能提
升。

图 3-2 自适应透明压缩示意图
1) 压缩比可达到1:2 至1:20 甚至更优,远远高于行存储;
2) 节省50%-90%的存储空间,大大降低数据处理能耗;
3) 内置数十种不同等级的压缩算法。上图展示了一种对数值型数据的压
缩算法;



GBase 8a MPP Cluster 技术白皮书
南大通用数据技术股份有限公司

- 9 -
4) 压缩态下对I/O 要求大大降低,数据加载和查询性能明显提升。

(SQL 管理 API)
随同 admin() 或 task() 函数,使用 cdr list trustedhost 参数来罗列来自于数据库服
务器的 REMOTE_SERVER_CFG 配置参数指定文件的可信任主机信息。
语法

用法
您必须是“数据库服务器管理员”(DBSA)才能运行这个函数。
示例
下列命令罗列来自于数据库服务器的可信任主机文件的可信任主机条目:
EXECUTE FUNCTION task("cdr list trustedhost");
下列示例输出显示使用 cdr list trustedhost 参数可能的结果。
myhost1 user_1
myhost1.example.com user_1
myhost2 user_2
myhost2.example.com user_2