返回首页

gbase数据、南大通用产品文档:GBase8sindex compress repack shrink 参数:优化

更新日期:2024年09月11日

B-tree 索引的存储(SQL 管理 API)
随同 admin() 或 task() 函数,使用 index compress repack shrink 参数来压缩分离的
B-tree 索引,合并空闲空间(重新打包)并归还分区中的空闲空间(收缩)。
语法:索引压缩命令参数

GBase 8s 管理员参考
南大通用数据技术股份有限公司 - 752 -

命令参数
下表包含每一参数的简要说明。
表 1. 索引压缩操作的参数
参数
描述
compress
压缩索引。
parallel
并行地运行压缩或重新打包操作。
为每一表的分片或分片列
表启动一个线程,且跨越这些分片并行地运行该操作。
repack
通过将数据移到索引的前部来合并空闲空间。
shrink
将索引末端的空闲空间归还到 dbspace,从而减少索引的总
大小。

命令元素
下表显示您可用来压缩、重新打包和收缩索引的元素。
表 2. 索引压缩命令元素
元素
描述
关键考虑
index_name
您想要压缩的索引名称。
必需的。
您必须使用系统目录表中相同的大写或小
写字母。
database_name
包含您想要压缩的索引的
数据库名。
可选的。
如果您未指定数据库,
则数据库服务器使用

GBase 8s 管理员参考
南大通用数据技术股份有限公司 - 753 -
元素
描述
关键考虑
当前的数据库。
如果您输入数据库名,
则必须使用与系统目
录表中相同的大写或小写字母。
owner
包含您想要压缩的索引的
数据库的所有者名。
可选的。
如果您未指定所有者,
则数据库服务器使用
当前的所有者。
如果您输入所有者名,
则必须使用与系统目
录表中相同的大写或小写字母。

用法
您可压缩一个在分片的或未分片的表上分离的 B-tree 索引。
要被压缩,索引必须有至少 2000 个键。如果索引内的分片没有至少 2000 个键,则当创
建索引时数据库服务器不压缩索引或分片。即使有新的键添加到索引,索引也保持不压缩。
如果您想要压缩该索引,
请运行另一个带有 index
compress 参数的 SQL 管理 API
task()
或 admin() 函数。
要确定索引是否包含最小键数,请运行 oncheck -pT 命令并查看 Number of keys 域中的
信息。
通常情况下,请您在压缩操作之后执行重新打包操作,并在重新操作之后执行收缩。
压缩操作仅压缩索引的叶子(底层)。
你可取消操作,例如在 DB-Access 中按下 CTRL-C。
你不可解压缩索引。如果您想要解压缩索引,则可删除压缩的索引并重新创建它。
示例
下列命令并行地压缩、重新打包并收缩索引。
EXECUTE FUNCTION task("index compress repack shrink parallel",
"ind5", "customer", "jayson");

GS_SESSION_MEM
ORY_DETAIL、20.3.72
PG_STAT_ACTIVITY
和log_line_prefix 参数。
上表有关参数级别的说明请参见表6-16。
表6-16 日志级别参数说明
级别
说明
DEBUG[1-5]
提供开发人员使用的信息。5 级为最高级别,依次类推,1 级为最低

GBase 8c V5 开发者手册
南大通用数据技术股份有限公司
136
级别。
INFO
提供用户隐含要求的信息。
如在VACUUM VERBOSE 过程中的信息。
NOTICE
提供可能对用户有用的信息。如长标识符的截断,作为主键一部分创
建的索引。
WARNING
提供给用户的警告。如在事务块范围之外的COMMIT。
ERROR
报告导致当前命令退出的错误。
LOG
报告一些管理员感兴趣的信息。如检查点活跃性。
FATAL
报告导致当前会话终止的原因。
PANIC
报告导致所有会话退出的原因。
7
管理数据库安全

语法
Logistic 回归的训练函数的语法如下:
logregr_train( source_table,
out_table,
dependent_varname,
independent_varname,
max_iter,
optimizer,
tolerance
)
参数说明

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953(2022-09-15)
南大通用数据技术股份有限公司
1423

source_table:含训练数据的输入表。

out_table:保存训练结果的结果表。

dependent_varname:因变量的列名。因变量列应为布尔值,非布尔值会在处
理过程中被隐式转换为布尔值。

independent_varname:自变量的列名,数组类型。

max_iter:最大的迭代次数。

optimizer:迭代过程中使用的优化器。

tolerance:容忍度。两次迭代的对数似然差小于该值则结束迭代。
结果表说明
训练函数成功执行后,会创建保存模型信息的结果表,结果表包含如下字段用来
表示模型信息:

coef:相关系数,用于预测。

log_likelihood:对数似然值,训练中评估模型的参数。

std_err:相关系数的标准差。

z_stats:相关系数的z-统计量。

num_rows_processed:处理的数据行数。

num_missing_rows_skipped:略过的数据行数。

num_iterations:迭代次数。
摘要表说明
训练结束还会生出一个摘要表,其名为为结果表表名加上”_summary”,摘要表的
字段说明如下:

method:挖掘算法名称,为logregr。

source_table:输入表名。

out_table:结果表名。

dependent_varname:因变量名。

independent_varname:自变量名。

optimizer_params:优化器参数,最大迭代次数、容忍度等。

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953(2022-09-15)
南大通用数据技术股份有限公司
1424

num_failed_groups:训练失败的分组数。

num_rows_processed:处理的数据行数。

num_missing_rows_skipped:略过的数据行数。