传递闭包与谱聚类结合的多中心模糊C均值算法探索

0 下载量 58 浏览量 更新于2024-08-26 收藏 3.36MB PDF 举报
"该研究论文探讨了一种基于传递闭包和谱聚类的多中心模糊C均值(Fuzzy C-means, FCM)算法。文章由武汉理工大学、武汉纺织大学和华中科技大学的研究人员共同完成,发表在《应用软计算》期刊上。该算法旨在改进传统的模糊C均值聚类方法,解决其在处理复杂数据集时存在的问题,如单中心限制和对噪声数据的敏感性。" 正文: 模糊C均值(Fuzzy C-means)算法是数据挖掘和机器学习领域中广泛应用的一种聚类方法,因其能够处理具有模糊边界的样本而备受青睐。然而,传统的FCM算法存在一些局限性,比如它通常假设数据集只有一个中心,这可能无法准确反映实际中复杂的数据结构。此外,FCM对于异常值或噪声也比较敏感,这些因素都可能导致聚类结果的不理想。 本研究论文提出了一种新的多中心模糊C均值算法,该算法结合了传递闭包和谱聚类的概念。传递闭包是一种在图论中用于分析节点间关系的方法,它可以捕捉数据之间的非对称性和传递性。在聚类场景中,传递闭包可以帮助识别样本之间的隐含关联,增强聚类的连通性和稳定性。 另一方面,谱聚类是一种利用数据的相似性矩阵的谱特性进行聚类的技术,它能有效处理非凸形状的簇。通过将这两种方法整合到FCM算法中,研究者旨在克服传统FCM的单中心限制,同时利用谱聚类来改善对噪声和复杂结构的处理能力。 论文详细介绍了算法的设计过程,包括如何构建传递闭包矩阵以及如何结合谱聚类来确定多中心。实验部分对比了新算法与传统FCM和其他聚类方法在多种数据集上的性能,验证了新算法在处理复杂数据结构时的优越性。关键词包括模糊C均值、多中心、格子相似性以及谱聚类,表明了该研究的主要关注点和理论基础。 这篇研究论文为复杂数据集的聚类提供了一个新颖且强大的工具,通过结合不同的理论概念,提高了聚类的准确性和鲁棒性。这一方法不仅对数据挖掘领域有贡献,也为解决现实世界中的复杂问题提供了新的思路。