silhouette coefficient
时间: 2023-06-05 13:48:02 浏览: 124
基于噪声数据集处理的K-means聚类算法实现源码(高分毕设).zip
Silhouette Coefficient是一种评估聚类结果的指标,用于评估一个样本在一个聚类中的相似程度。它表示一个样本与同簇内其他样本的平均距离与不同簇间样本的平均距离之间的比值。
公式为:
$$s(i) = frac{b(i) - a(i)}{max{a(i), b(i)}}$$
其中,$a(i)$表示样本$i$与同簇内其他样本的平均距离,$b(i)$表示样本$i$与不同簇间样本的平均距离。
Silhouette Coefficient的值介于-1到1之间,其中1表示完美的聚类,-1表示样本被错误地分配到了不同的簇。0表示样本被分配到的簇的边界处。
因此,Silhouette Coefficient可以用于评估聚类结果的好坏,并选择最佳的聚类数量。
阅读全文