返回首页

gbase数据、南大通用产品文档:GBase8cqrw_inlist2join_optmode

更新日期:2024年09月11日

参数说明:控制是否使用inlist-to-join 查询重写。

GBase 8c V5 开发者手册
南大通用数据技术股份有限公司
1243
该参数属于USERSET 类型参数,请参考表15-1 中对应设置方法进行设置。
取值范围:字符串

disable:关闭inlist2join 查询重写。

cost_base:基于代价的inlist2join 查询重写。

rule_base:基于规则的inlist2join 查询重写,即强制使用inlist2join 查询重写。

任意正整数:
inlist2join 查询重写阈值,
即list 内元素个数大于该阈值,
进行inlist2join
查询重写。
默认值:cost_base

INSERT 或 UPDATE 语句不执行智能大对象数据的实际输入。然而,它确实为应用程序
提供一种方式,来标识哪些智能大对象数据与该列相关联。
数据库表中的 BLOB 或 CLOB 列存储智能大对象的智能大对象指针结构。因此,当您存
储 BLOB 或 CLOB 列时,请为 INSERT 或 UPDATE 语句的 loptr 变量中的列提供智
能大对象指针结构。
下图展示应用程序如何将智能大对象的数据转移至数据库服务器。
图: 将智能大对象数据由客户机应用程序转移至数据库服务器


如果智能大对象指针结构存在,则智能大对象指针结构标识的智能大对象存在。当在数据
库中存储智能大对象指针结构时,数据库服务器适时地重新分配智能大对象。
如果应用程序未在数据库中存储新的智能大对象的智能大对象指针结构,则当将该指针传
给应用程序时,智能大对象指针结构仅对访问智能大对象的当前版本有效。如果后来更新
了智能大对象,则该指针无效。当对象版本更改时,在行中存储的智能大对象指针结构不
过期。

GBase 8s ODBC Driver 程序员指南
南大通用数据技术股份有限公司
- 105 -

当您检索一行,然后更新该行中包含的智能大对象时,数据库服务器在该行更新智能大对
象时排他锁定该行。此外,如果智能大对象花费很长时间来更新或创建,则智能大对象的
长时间更新
(无论是否启用日志记录,
以及是否与表行相关联)
会造成潜在的长事务条件。
在数据库中的 CLOB 或 BLOB 列中存储智能大对象指针结构,而不是 CLOB 或 BLOB
数据本身。因此,诸如 INSERT 和 SELECT 这样的 SQL 语句接受并返回智能大对象指
针结构作为智能大对象列的列值。

语法
支持向量机分类模型的训练函数的语法如下:
svm_classification(
source_table,
model_table,
dependent_varname,
independent_varname,
params
)
参数说明

source_table:含训练数据的输入表。

model _table:保存训练结果的结果表。

dependent_varname:因变量的列名。

independent_varname:自变量的列名,数组类型。

params:模型训练参数。
其中的模型训练参数(params)是以逗号分割的键-值(key-value)对,支持的键值
如下:
init_stepsize(初始步长)
缺省值: [0.01]. 初始的学习步长。一个比较小的值可以保证收敛结果,而较
大的值可以提高修炼速度。
decay_factor(衰减系数)。
缺省值:[0.9].控制迭代过程中使用的学习步长: 0 表示恒定步长; -1 表示反
向缩放,步长= 初始步长/ 迭代次数; > 0 表示指数衰减, 步长= 初始步
长*衰减系数^迭代次数。
max_iter(最大迭代次数)
缺省值:[100].
tolerance(容忍度)

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953(2022-09-15)
南大通用数据技术股份有限公司
1429
缺省值:1e-10. 两次迭代的模型差值小于容忍度时结束迭代。
Lambda(正则化参数)
缺省值:[0.01]. 必须大于0,不能为负值。
结果表说明
训练函数成功执行后,会创建保存模型信息的结果表,结果表包含如下字段用来
表示模型信息:

coef:相关系数,用于预测。

loss:损失函数值。

norm_of_gradient:损失函数的梯度值。

num_iterations:迭代次数。

num_rows_processed:处理的数据行数。

num_rows_skipped:略过的数据行数。

dep_var_mapping:因变量的可能取值。
摘要表说明
训练结束还会生出一个摘要表,其名为结果表表名加上”_summary”,摘要表的字
段说明如下:

method:挖掘算法名称,SVC 代表SVM 分类算法。

source_table:输入表名。

model_table:结果表名。

dependent_varname:因变量名。

independent_varname:自变量名。

grouping_col:分组列名。

optim_params:优化参数。

num_all_groups:全部分组数。

num_failed_groups:训练失败分组数。

total_rows_processed:处理的数据行数。

total_rows_skipped:略过的数据行数。

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953(2022-09-15)
南大通用数据技术股份有限公司
1430