什么是Kmeans聚类?原理是什么?基本思路什么?是谁提出来的?
时间: 2023-12-24 08:22:17 浏览: 95
Kmeans聚类算法-手肘法
5星 · 资源好评率100%
Kmeans聚类是一种基于聚类分析的无监督学习算法,其主要目标是将给定的数据集划分为K个不同的类别,使得每个数据点都属于其所属类别的中心点,同时最小化所有数据点与其所属类别中心点之间的距离和。
该算法基于以下原理:将数据点分为不同的类别时,类别内部的数据点应该具有相似的特征,而类别之间的数据点应该具有明显的区别。因此,Kmeans算法通过计算数据点之间的距离,并利用贪心策略将数据点分配到最近的中心点所对应的类别中,然后通过更新中心点的位置,不断迭代优化,直到达到最优解。
该算法的基本思路如下:
1. 选择K个中心点作为初始聚类中心;
2. 将所有数据点分配到距离其最近的中心点所对应的聚类中心中;
3. 根据已经分配的数据点,重新计算每个聚类中心的位置;
4. 重复2和3步骤,直到聚类中心不再发生变化或达到预设的迭代次数。
Kmeans聚类算法最早由J. MacQueen在1967年提出,后来由其他学者不断改进和优化。
阅读全文