k-means算法推理步骤公式详解
时间: 2023-02-24 13:12:54 浏览: 109
K-means算法是一种常用的聚类分析算法,用于将数据点划分为k个不同的簇。其步骤如下:
1. 随机选择k个初始聚类中心。
2. 对于每一个数据点,计算其到每个聚类中心的距离,并将其分配给最近的聚类中心。
3. 对于每个聚类,计算所有分配给该聚类的数据点的平均值,并将该平均值作为新的聚类中心。
4. 重复步骤2和3,直到聚类中心不再变化或达到最大迭代次数。
下面是k-means算法的主要公式:
设数据点集为X={x1,x2,…,xn},其中xi是n维特征向量,聚类中心为C={c1,c2,…,ck},其中ci是k维特征向量。
- 计算数据点到聚类中心的距离:
d(xi, cj) = √(xi1-cj1)^2 + (xi2-cj2)^2 + … + (xin-cjn)^2
- 对于数据点xi,找到其最近的聚类中心:
ci(xi) = argminj(d(xi, cj))
- 计算新的聚类中心:
ci = (1/n) * ∑xi (xi属于第i个聚类)
- 重复步骤2和3,直到聚类中心不再变化或达到最大迭代次数。
总的来说,K-means
阅读全文