gbase数据、南大通用产品文档：gbase,数据,gbase数据,南大通用 GBase8a训练函数

语法
Logistic 回归的训练函数的语法如下：
logregr_train( source_table,
out_table,
dependent_varname,
independent_varname,
max_iter,
optimizer,
tolerance
)
参数说明

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953（2022-09-15）
南大通用数据技术股份有限公司
1423

source_table：含训练数据的输入表。

out_table：保存训练结果的结果表。

dependent_varname：因变量的列名。因变量列应为布尔值，非布尔值会在处
理过程中被隐式转换为布尔值。

independent_varname：自变量的列名，数组类型。

max_iter：最大的迭代次数。

optimizer：迭代过程中使用的优化器。

tolerance：容忍度。两次迭代的对数似然差小于该值则结束迭代。
结果表说明
训练函数成功执行后，会创建保存模型信息的结果表，结果表包含如下字段用来
表示模型信息：

coef：相关系数，用于预测。

log_likelihood：对数似然值，训练中评估模型的参数。

std_err：相关系数的标准差。

z_stats：相关系数的z-统计量。

num_rows_processed：处理的数据行数。

num_missing_rows_skipped：略过的数据行数。

num_iterations：迭代次数。
摘要表说明
训练结束还会生出一个摘要表，其名为为结果表表名加上”_summary”，摘要表的
字段说明如下：

method：挖掘算法名称，为logregr。

source_table：输入表名。

out_table：结果表名。

dependent_varname：因变量名。

independent_varname：自变量名。

optimizer_params：优化器参数，最大迭代次数、容忍度等。

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953（2022-09-15）
南大通用数据技术股份有限公司
1424

num_failed_groups：训练失败的分组数。

num_rows_processed：处理的数据行数。

num_missing_rows_skipped：略过的数据行数。

函数说明
返回逆序输出的字符串。
示例
示例1：将“abc”按从右到左的顺序输出。
gbase> SELECT REVERSE('abc') FROM dual;
+----------------+
| REVERSE('abc') |
+----------------+
| cba
|
+----------------+
1 row in set

commit_delay
参数说明：表示一个已经提交的数据在WAL 缓冲区中存放的时间。
该参数属于USERSET 类型参数，请参考表15-1 中对应设置方法进行设置。
须知：
- 设置为非0 值时事务执行commit 后不会立即写入WAL 中，而仍存放在WAL 缓冲

GBase 8c V5 开发者手册
南大通用数据技术股份有限公司
1201
区中，等待WalWriter 进程周期性写入磁盘。
如果系统负载很高，在延迟时间内，
其他事务可能已经准备好提交。
但如果没有事务准
备提交，这个延迟就是在浪费时间。
取值范围：整型，0～100000，单位为微秒，其中0 表示无延迟。
默认值：0

gbase数据、南大通用产品文档：GBase8a训练函数