返回首页

gbase数据、南大通用产品文档:GBase8sset index compression 参数:

更新日期:2024年09月11日

更改索引页压
缩(SQL 管理 API)
随同 admin() 或 task() 函数,使用 set index compression 参数来更改合并两个部分地使用
的索引页的级别。
语法

元素
描述
关键考虑
partition_number
分区号。 请在 systables 系统目录表的 partnum 列中找到该分区
号。


GBase 8s 管理员参考
南大通用数据技术股份有限公司 - 790 -

用法
请使用这个函数来调整索引页压缩。如果在那些页上的数据合计到设置的级别,则合并这
些页。如果您的索引快速地增长,要优化空间和事务处理,则可降低压缩级别。如果您的
索引有很少的删除和插入操作或如果执行批量更新,则可提高级别。
如果您预计索引会以频繁的分裂快速地增长,则请使用 low 参数。
如果索引的增长或更改适中,则请使用 med 或 default 参数。
如果索引 90% 或更多为 read-only,或者有许多更改,则请使用 high 参数。
这个函数等同于 onmode -C 命令以及 BTSCANNER 配置参数的 compression 选项。
示例
下列示例设置分区的索引压缩为 high:
EXECUTE FUNCTION task("set index compression","1048611","high");

导出ORC 文件说明

orc 文件导出语法同8a 的常规导出:
select ... into outfile 'file_name' [option] from ...;
select ... from ... into outfile 'file_name' [option];
option 参数支持情况:
1.可正常使用的参数:outfilemode by、writemode by、filecount、filesize、character
set
2.语法可通过并正常执行,但实际不起作用,会报warnings 的参数:files/columns
terminated by、files/columns enclosed by、files/columns escaped by、lines terminated
by、lines starting by、files/columns double_enclosed by、null_value、files/columns
length、with head

orc 文件导出支持本地、ftp、sftp、hdfs 方式导出

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953(2022-04-10)
南大通用数据技术股份有限公司
1229

orc 文件导出不支持远程导出(rmt)、kafka 导出、http 导出

orc 文件导出需指定导出文件名后缀为".orc"或者".ORC"。不支持导出压缩的
orc 文件,如后缀为.orc.gz 导出的仍然为压缩的文本文件

orc 文件导出支持配置导出的orc 文件参数:stripe 大小(默认64M)、orc 文件
内部的数据压缩格式(none/zlib/zstd)、orc 文件压缩块大小(默认64k),可通过
配置文件、global、session 参数设置实现,如:
set global gbase_export_orc_stripe_size=67108864
set global gbase_export_orc_compression_kind=zlib;
set global gbase_export_orc_compression_block_size=65536
注:数字单位均为字节

orc 文件导出支持设置导出orc 文件大小超限分裂,通过参数filesize 指定查
询结果有效数据长度大于等于filesize 值时,
分裂成新的文件(数据以行保存,
新数据文件不会跨行截断保存)。
filesize 默认值为0,
即不限制导出文件大小,
filesize 的单位默认为字节,支持K/M/G 写法,如64M/16G.

orc 文件导出支持设置并行导出ORC 文件到HDFS 的文件个数,由参数
filecount 指定,默认不限制并行导出的文件个数,即并行导出每个分片为一
个文件。如果同时指定filecount 和filesize 参数,则表示并行导出filecount
组文件,每组文件按filesize 自动分裂。只对导出到HDFS 有效。

orc 文件导出支持设置导出文件自动创建目标目录,即导出时自动创建与导
出文件同名的目标目录,可使用参数gbase_export_directory 控制,默认值为
1 表示自动创建,设置为0 时不创建文件名的同名目录。该参数支持配置文
件、global、session 设置。

操作符含义
当查询多个关键词时,满足匹配数量的关键词。英文词以空格分割,中文以一个
字为一个词,查询的内容需要使用引号""括起来。
例如查询语句条件为"the great wall is a wonderful place"/3 表示只要满足其中3 个
查询的词即为符合条件。
示例
gbase> SELECT MB_Text FROM sms WHERE contains(MB_Text, '"the
great wall is a wonderful place"/3');
+--------------------------------------------------------------+
| MB_Text
|

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953(2022-04-10)
南大通用数据技术股份有限公司
939
+--------------------------------------------------------------+
| the great wall is so wonderful ,i like this place.
|
+--------------------------------------------------------------+
1 row in set