返回首页

gbase数据、南大通用产品文档:GBase8a训练函数

更新日期:2024年09月11日

语法
Logistic 回归的训练函数的语法如下:
logregr_train( source_table,
out_table,
dependent_varname,
independent_varname,
max_iter,
optimizer,
tolerance
)
参数说明

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953(2022-09-15)
南大通用数据技术股份有限公司
1423

source_table:含训练数据的输入表。

out_table:保存训练结果的结果表。

dependent_varname:因变量的列名。因变量列应为布尔值,非布尔值会在处
理过程中被隐式转换为布尔值。

independent_varname:自变量的列名,数组类型。

max_iter:最大的迭代次数。

optimizer:迭代过程中使用的优化器。

tolerance:容忍度。两次迭代的对数似然差小于该值则结束迭代。
结果表说明
训练函数成功执行后,会创建保存模型信息的结果表,结果表包含如下字段用来
表示模型信息:

coef:相关系数,用于预测。

log_likelihood:对数似然值,训练中评估模型的参数。

std_err:相关系数的标准差。

z_stats:相关系数的z-统计量。

num_rows_processed:处理的数据行数。

num_missing_rows_skipped:略过的数据行数。

num_iterations:迭代次数。
摘要表说明
训练结束还会生出一个摘要表,其名为为结果表表名加上”_summary”,摘要表的
字段说明如下:

method:挖掘算法名称,为logregr。

source_table:输入表名。

out_table:结果表名。

dependent_varname:因变量名。

independent_varname:自变量名。

optimizer_params:优化器参数,最大迭代次数、容忍度等。

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953(2022-09-15)
南大通用数据技术股份有限公司
1424

num_failed_groups:训练失败的分组数。

num_rows_processed:处理的数据行数。

num_missing_rows_skipped:略过的数据行数。

函数说明
返回逆序输出的字符串。
示例
示例1:将“abc”按从右到左的顺序输出。
gbase> SELECT REVERSE('abc') FROM dual;
+----------------+
| REVERSE('abc') |
+----------------+
| cba
|
+----------------+
1 row in set

commit_delay
参数说明:表示一个已经提交的数据在WAL 缓冲区中存放的时间。
该参数属于USERSET 类型参数,请参考表15-1 中对应设置方法进行设置。
须知:
- 设置为非0 值时事务执行commit 后不会立即写入WAL 中,而仍存放在WAL 缓冲

GBase 8c V5 开发者手册
南大通用数据技术股份有限公司
1201
区中,等待WalWriter 进程周期性写入磁盘。
如果系统负载很高,在延迟时间内,
其他事务可能已经准备好提交。
但如果没有事务准
备提交,这个延迟就是在浪费时间。
取值范围:整型,0~100000,单位为微秒,其中0 表示无延迟。
默认值:0