返回首页

gbase数据、南大通用产品文档:GBase8s

更新日期:2024年09月11日

Cannot determine the table name
查询中的表名不正确或引用的表不存在。

示例中用到的表及数据:
DROP TABLE IF EXISTS cust;
CREATE TABLE cust(c_id INT, c_name VARCHAR(20), c_addr VARCHAR(100));
INSERT INTO cust VALUES (1, 'xiaoming', 'Tianjin');
INSERT INTO cust VALUES (3, 'qiaorui', 'Hebei');
INSERT INTO cust VALUES (4, 'tianfei', 'Anhui');
INSERT INTO cust VALUES (2, 'zhangling', 'Hunan');
示例1:不指定字段分隔符,即使用默认字段分隔符“\t”。
gbase> rmt:SELECT * FROM cust INTO OUTFILE '/home/gbase/temp/cust.txt';
查看导出文件:
$ cat cust.txt
1 xiaoming Tianjin
3 qiaorui Hebei
4 tianfei Anhui
2 zhangling Hunan

kmeans_random 算法通过随机选取种子点来开始迭代,实现简单,但如果初始种
子选取不当,则聚类的结果可能不理想。
语法
kmeans_random 函数的语法如下:
kmeans_random( source_table,
expr_point,
k,
fn_dist,
max_num_iterations,
min_frac_reassinged
)
参数说明

source_table:含训练数据的输入表,形如“库名.表名”,库名不可省略,
以便在对应的库中建立结果表。

expr_point:表达式,用于从表中计算得到坐标点。

k:最终的类簇数量。

fn_dist:用于计算点距的函数名,参见
,推荐使用squared_dist_norm2。

max_num_iterations:最大的迭代次数。

min_frac_reassinged:
容忍度,
迭代过程中如发现分组发生变化的点数占总点
数量的比例小于该值则结束迭代。