gbase数据、南大通用产品文档：gbase,数据,gbase数据,南大通用 GBase8sindex compress repack shrink 参数：优化

B-tree 索引的存储（SQL 管理 API）
随同 admin() 或 task() 函数，使用 index compress repack shrink 参数来压缩分离的
B-tree 索引，合并空闲空间（重新打包）并归还分区中的空闲空间（收缩）。
语法：索引压缩命令参数

GBase 8s 管理员参考
南大通用数据技术股份有限公司 - 752 -

命令参数
下表包含每一参数的简要说明。
表 1. 索引压缩操作的参数
参数
描述
compress
压缩索引。
parallel
并行地运行压缩或重新打包操作。
为每一表的分片或分片列
表启动一个线程，且跨越这些分片并行地运行该操作。
repack
通过将数据移到索引的前部来合并空闲空间。
shrink
将索引末端的空闲空间归还到 dbspace，从而减少索引的总
大小。

命令元素
下表显示您可用来压缩、重新打包和收缩索引的元素。
表 2. 索引压缩命令元素
元素
描述
关键考虑
index_name
您想要压缩的索引名称。
必需的。
您必须使用系统目录表中相同的大写或小
写字母。
database_name
包含您想要压缩的索引的
数据库名。
可选的。
如果您未指定数据库，
则数据库服务器使用

GBase 8s 管理员参考
南大通用数据技术股份有限公司 - 753 -
元素
描述
关键考虑
当前的数据库。
如果您输入数据库名，
则必须使用与系统目
录表中相同的大写或小写字母。
owner
包含您想要压缩的索引的
数据库的所有者名。
可选的。
如果您未指定所有者，
则数据库服务器使用
当前的所有者。
如果您输入所有者名，
则必须使用与系统目
录表中相同的大写或小写字母。

用法
您可压缩一个在分片的或未分片的表上分离的 B-tree 索引。
要被压缩，索引必须有至少 2000 个键。如果索引内的分片没有至少 2000 个键，则当创
建索引时数据库服务器不压缩索引或分片。即使有新的键添加到索引，索引也保持不压缩。
如果您想要压缩该索引，
请运行另一个带有 index
compress 参数的 SQL 管理 API
task()
或 admin() 函数。
要确定索引是否包含最小键数，请运行 oncheck -pT 命令并查看 Number of keys 域中的
信息。
通常情况下，请您在压缩操作之后执行重新打包操作，并在重新操作之后执行收缩。
压缩操作仅压缩索引的叶子（底层）。
你可取消操作，例如在 DB-Access 中按下 CTRL-C。
你不可解压缩索引。如果您想要解压缩索引，则可删除压缩的索引并重新创建它。
示例
下列命令并行地压缩、重新打包并收缩索引。
EXECUTE FUNCTION task("index compress repack shrink parallel",
"ind5", "customer", "jayson");

GS_SESSION_MEM
ORY_DETAIL、20.3.72
PG_STAT_ACTIVITY
和log_line_prefix 参数。
上表有关参数级别的说明请参见表6-16。
表6-16 日志级别参数说明
级别
说明
DEBUG[1-5]
提供开发人员使用的信息。5 级为最高级别，依次类推，1 级为最低

GBase 8c V5 开发者手册
南大通用数据技术股份有限公司
136
级别。
INFO
提供用户隐含要求的信息。
如在VACUUM VERBOSE 过程中的信息。
NOTICE
提供可能对用户有用的信息。如长标识符的截断，作为主键一部分创
建的索引。
WARNING
提供给用户的警告。如在事务块范围之外的COMMIT。
ERROR
报告导致当前命令退出的错误。
LOG
报告一些管理员感兴趣的信息。如检查点活跃性。
FATAL
报告导致当前会话终止的原因。
PANIC
报告导致所有会话退出的原因。
7
管理数据库安全

语法
Logistic 回归的训练函数的语法如下：
logregr_train( source_table,
out_table,
dependent_varname,
independent_varname,
max_iter,
optimizer,
tolerance
)
参数说明

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953（2022-09-15）
南大通用数据技术股份有限公司
1423

source_table：含训练数据的输入表。

out_table：保存训练结果的结果表。

dependent_varname：因变量的列名。因变量列应为布尔值，非布尔值会在处
理过程中被隐式转换为布尔值。

independent_varname：自变量的列名，数组类型。

max_iter：最大的迭代次数。

optimizer：迭代过程中使用的优化器。

tolerance：容忍度。两次迭代的对数似然差小于该值则结束迭代。
结果表说明
训练函数成功执行后，会创建保存模型信息的结果表，结果表包含如下字段用来
表示模型信息：

coef：相关系数，用于预测。

log_likelihood：对数似然值，训练中评估模型的参数。

std_err：相关系数的标准差。

z_stats：相关系数的z-统计量。

num_rows_processed：处理的数据行数。

num_missing_rows_skipped：略过的数据行数。

num_iterations：迭代次数。
摘要表说明
训练结束还会生出一个摘要表，其名为为结果表表名加上”_summary”，摘要表的
字段说明如下：

method：挖掘算法名称，为logregr。

source_table：输入表名。

out_table：结果表名。

dependent_varname：因变量名。

independent_varname：自变量名。

optimizer_params：优化器参数，最大迭代次数、容忍度等。

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953（2022-09-15）
南大通用数据技术股份有限公司
1424

num_failed_groups：训练失败的分组数。

num_rows_processed：处理的数据行数。

num_missing_rows_skipped：略过的数据行数。

gbase数据、南大通用产品文档：GBase8sindex compress repack shrink 参数：优化