kmeans聚类算法 sql
时间: 2023-10-05 11:09:23 浏览: 100
k-means是一种常用的聚类算法,可以通过MADlib在SQL中进行实现。具体语法为:kmeanspp(rel_source, expr_point, k, fn_dist, agg_centroid, max_num_iterations, min_frac_reassigned, seeding_sample_ratio)。这个算法在MADlib 1.10.0官方文档中得到了提及,并且是唯一提到的聚类算法。该算法的基本思想是将数据集分为k个簇,每个簇都有一个中心点,通过不断迭代,将数据点分配给最近的簇,并更新簇的中心点,直到达到指定的迭代次数或者满足停止条件。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [MADlib——基于SQL的数据挖掘解决方案(26)——聚类之k-means方法](https://blog.csdn.net/wzy0623/article/details/79537352)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
阅读全文