返回首页

gbase数据、南大通用产品文档:GBase8a,

更新日期:2024年09月11日

65000,
1450,
12000)

训练一个支持向量机分类模型。
SELECT mllib.svm_classification(
'test.houses',
'test.houses_svm',
'price < 100000',
'array double[1, tax, bath, size]',
'max_iter=20'
);

查看训练结果。
gbase> SELECT * FROM houses_svm\G
*************************** 1. row ***************************
coef: 0.103513, -1.17016, -0.0573659, 1.29247
loss: 14119.6
norm_of_gradient: 21880
num_iterations: 20
num_rows_processed: 15
num_rows_skipped: 0
dep_var_mapping: 0,1
1 row in set (Elapsed: 00:00:00.00)
gbase> SELECT * FROM houses_svm_summary\G
*************************** 1. row ***************************
method: SVC
source_table: test.houses
model_table: test.houses_svm
dependent_varname: price < 100000
independent_varname: array double[1, tax, bath, size]
grouping_col: NULL
optim_params: init_stepsize=0.01,
decay_factor=0.9,
max_iter=20,
tolerance=1e-10,

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953(2022-04-10)
南大通用数据技术股份有限公司
1440
epsilon=0.01,
eps_table=,
class_weight=
num_all_groups: 1
num_failed_groups: 0
total_rows_processed: 15
total_rows_skipped: 0
1 row in set (Elapsed: 00:00:00.00)

用模型进行预测。
gbase> SELECT mllib.svm_predict('test.houses_svm', 'test.houses', 'id', 'test.houses_pred')
as result;
+---------+
| result
|
+---------+
| Success |
+---------+
1 row in set (Elapsed: 00:00:00.02)
gbase> SELECT id, prediction, (price < 100000) as pred_target FROM houses JOIN
houses_pred USING (id) ORDER BY id;
+------+------------+-------------+
| id
| prediction | pred_target |
+------+------------+-------------+
|
1 |
1 |
1 |
|
2 |
1 |
1 |
|
3 |
1 |
1 |
|
4 |
1 |
1 |
|
5 |
1 |
0 |
|
6 |
0 |
1 |
|
7 |
0 |
0 |
|
8 |
1 |
0 |
|
9 |
0 |
0 |
|
10 |
0 |
0 |
|
11 |
0 |
1 |
|
12 |
0 |
0 |

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953(2022-04-10)
南大通用数据技术股份有限公司
1441
|
13 |
0 |
0 |
|
14 |
0 |
0 |
|
15 |
1 |
1 |
+------+------------+-------------+
15 rows in set (Elapsed: 00:00:00.00)
如上的预测查询语句是使用支持向量机模型判断房屋价格是否少于100000。
id 列
为房屋编号,
prediction 列是预测结果(1 代表少于100000,
0 代表不少于100000),
pred_target 是实际情况,从输出结果看出支持向量机模型基本正确。

SNAPSHOT 表记录当前系统中存储的WDR 快照数据的索引信息、开始时间和结束时
间。只能在系统库中查询到结果,在用户库中无法查询。
名称
类型
描述
示例
snapshot_id
bigint
WDR 快照序号。
1
start_ts
timestamp
WDR 快照的开始时间。
2019-12-28 17:11:27.423742+0
8
end_ts
timestamp
WDR 快照的结束时间。
2019-12-28 17:11:43.67726+08

GBase 8c V5 开发者手册
南大通用数据技术股份有限公司
1085

功能说明
记录集群层当前加密状态信息。
表结构说明
表5- 262 表结构信息说明:




COORDINATOR_NAM
E
节点名称
IS_CREATE
是否创建密钥
KEY_TYPE
密钥类型(0 明文。1 密文)
OPEN_STATUS
密钥打开状态(ON 打开,OFF 关闭)