新模糊聚类有效性指标:实验验证与最佳聚类数确定

需积分: 10 2 下载量 9 浏览量 更新于2024-09-09 收藏 1.43MB PDF 举报
本文主要探讨的是"新模糊聚类有效性指标"在模糊聚类领域的研究。模糊聚类作为一种在模式识别、机器学习和图像处理等众多领域广泛应用的方法,其核心算法之一是模糊C-均值聚类。这种算法需要预先设定聚类的数量,但聚类数的确定通常是挑战性的,因为它对最终结果有直接影响。 本文作者针对这一问题提出了一个新的聚类有效性指标,该指标旨在通过对划分熵、隶属度以及几何结构这三个关键特性进行量化,来评估聚类结果的紧凑度、分离度和重叠度。紧凑度衡量的是各个簇内的数据点紧密程度,分离度关注的是不同簇之间的区分度,而重叠度则衡量了不同簇之间的界限清晰度。通过这些度量,作者构建了一个系统的方法来判断聚类的有效性,并且寻找最优的聚类数目。 为了验证新指标的性能,研究者在六个人工数据集和三个真实世界的数据集上进行了实验。实验结果显示,新提出的聚类有效性指标与传统的聚类有效性指标相比,在评估聚类效果和确定最佳聚类数方面具有显著优势。它能够更准确地反映聚类的质量,因此在实际应用中具有很高的实用价值。 此外,本文还提到了研究团队的构成,包括耿嘉艺(硕士研究生,研究方向为模式识别和机器学习)、钱雪忠(副教授,研究方向为数据挖掘和机器学习)以及周世兵(讲师,博士,研究方向为模式识别和人工智能)。他们共同完成了这项关于模糊聚类有效性指标的研究,并得到了国家自然科学基金和中央高校基本科研业务费专项基金的支持。 这篇论文为模糊聚类中的聚类有效性评估提供了一种创新的方法,对于优化聚类过程、提高聚类结果的准确性具有重要的理论和实践意义。通过这种方法,研究人员可以更好地理解和调整模糊聚类算法,以适应不同应用场景的需求。