K-均值的目标函数是什么?如果K-means目标函数中的距离测度变为马氏距离,请推导出聚类分析的学习算法,这里称为扩展的K-means。
时间: 2024-05-19 11:16:58 浏览: 139
K-means算法是输入聚类个数k,以及包含 n个数据对象的数据库,输出满足方差最小标准k个聚类的一种算法
K-均值的目标函数是最小化所有样本点与所属簇中心点之间距离平方的总和,即:
J = ∑(xᵢ-cⱼ)²,其中xᵢ为第i个样本点,cⱼ为第j个簇的中心点。
如果将距离测度变为马氏距离,那么扩展的K-means的学习算法可以由以下步骤构成:
1.随机选择K个簇中心点。
2.对于每个样本点,计算马氏距离最短的簇中心点,并将该点分配给该簇。
3.对于每个簇,重新计算其中心点的位置,即计算该簇中所有样本点的平均值。
4.重复2-3步直到收敛。
其中,马氏距离的计算公式为:
d(x,y) = [(x-y)S^(-1)(x-y)^T]^1/2
其中S为样本点的协方差矩阵。
阅读全文