更新日期:2024年09月11日
kmeans_random 算法通过随机选取种子点来开始迭代,实现简单,但如果初始种
子选取不当,则聚类的结果可能不理想。
语法
kmeans_random 函数的语法如下:
kmeans_random( source_table,
expr_point,
k,
fn_dist,
max_num_iterations,
min_frac_reassinged
)
参数说明
source_table:含训练数据的输入表,形如“库名.表名”,库名不可省略,
以便在对应的库中建立结果表。
expr_point:表达式,用于从表中计算得到坐标点。
k:最终的类簇数量。
fn_dist:用于计算点距的函数名,参见
,推荐使用squared_dist_norm2。
max_num_iterations:最大的迭代次数。
min_frac_reassinged:
容忍度,
迭代过程中如发现分组发生变化的点数占总点
数量的比例小于该值则结束迭代。
MIN(),MAX()
函数说明
MIN([DISTINCT] expr),
MAX([DISTINCT] expr)返回expr 的最小值或最大值。
可
以为MIN()和MAX()设置参数,在这种情况下,它们将返回参数指定列的最小值
或最大值。DISTINCT 关键词可以被用来查找expr 的不同值的最小值或最大值,
然而,
这样产生的结果与省略DISTINCT 的结果相同。
MIN 和MAX 不包括NULL
值。
示例
示例1:返回lo_supplycost 列的最大值和最小值。
gbase> SELECT lo_shipmode,MAX(lo_supplycost),MIN(lo_supplycost)
FROM ssbm.lineorder GROUP BY lo_shipmode;
+-------------+--------------------+--------------------+
| lo_shipmode | MAX(lo_supplycost) | MIN(lo_supplycost) |
+-------------+--------------------+--------------------+
| AIR
|
125939 |
54060 |
| REG AIR
|
125939 |
54060 |
| TRUCK
|
125939 |
54060 |
| SHIP
|
125939 |
54060 |
| MAIL
|
125939 |
54060 |
| FOB
|
125939 |
54060 |
| RAIL
|
125939 |
54060 |
+-------------+--------------------+--------------------+
7 rows in set