聚类的外部评价指标有哪些
时间: 2024-04-19 21:12:41 浏览: 97
聚类算法评价指标:RandIndex,matlab代码
聚类的外部评价指标通常用于衡量聚类结果与事先已知的类别标签之间的相似度或差异性。常见的外部评价指标包括:
1. 精确度(Precision)和召回率(Recall):用于二分类问题,精确度是真正例(TP)占所有被分类为正例的样本(TP+FP)的比例,召回率是真正例(TP)占所有实际为正例的样本(TP+FN)的比例。
2. 调整兰德指数(Adjusted Rand Index,ARI):用于多分类问题,计算聚类结果与真实类别标签之间的相似度。
3. F1-Score:精确度和召回率的调和平均数,综合考虑了分类器的准确率和召回率。
4. 熵(Entropy)和互信息(Mutual Information):熵越小,说明聚类结果越好;互信息越大,说明聚类结果与真实类别标签越接近。
5. 约束归一化互信息(Normalized Mutual Information,NMI):将互信息归一化,使其值在0~1之间,便于比较不同数据集之间的聚类结果。
6. Fowlkes-Mallows指数(FMI):同时考虑了精确度和召回率,越接近1表示聚类结果与真实类别标签越相似。
7. Jaccard系数:用于衡量两个集合的相似度,将其应用于聚类评价中,可以衡量聚类结果与真实类别标签之间的相似度。
这些外部评价指标各有优缺点,需要根据具体问题和数据集的特点选择合适的指标进行评价。
阅读全文