基于清晰半径的模糊协同聚类改进算法

需积分: 0 0 下载量 170 浏览量 更新于2024-09-09 收藏 434KB PDF 举报
"高翠芳和张朔在论文中探讨了模糊协同聚类的改进方法,引入清晰半径的概念以优化模糊点的类别归属。他们提出了一种新算法,该算法利用超球体中心区域替代传统的类中心来计算相似性距离,从而在初始聚类结果上对模糊点进行更准确的归属计算,减少了边界模糊点的数量和分类错误。清晰半径的引入还有助于减小子集间协同系数的差异,简化参数设置。" 模糊聚类是一种在不确定或不精确数据中寻找群体结构的统计分析方法,它允许数据点同时属于多个类别,而FCM(Fuzzy C-Means)算法是模糊聚类中的经典算法。在传统的FCM算法中,每个数据点的隶属度是基于其与所有类中心的距离来计算的,这可能导致边界数据点的归属模糊。 这篇论文提出的改进算法针对这一问题,引入了“清晰半径”的概念。清晰半径可以理解为一个阈值,当数据点到类中心的距离小于这个阈值时,该点被认为更“清晰”地属于该类。通过使用清晰半径,新算法能够更准确地区分那些在边界上的模糊点,降低它们对聚类结果的影响。 协同聚类是一种多视图学习方法,它考虑了来自不同视角或数据集的信息,以提高聚类的准确性。在传统协同聚类中,各个子集间的协同系数可能因数据特性的差异而有所不同,导致聚类效果不稳定。本文的创新点在于,清晰半径的引入不仅优化了模糊点的归属,也使得不同子集间的协同更加均衡,从而降低了参数调整的复杂性。 实验结果显示,这种改进的算法在减少边界模糊点和纠正分类错误方面表现出色,且参数设置更为直观和简单。因此,该方法对于处理复杂数据集,尤其是在存在大量模糊边界的场景下,具有显著的实用价值和理论意义。 这篇研究为模糊聚类提供了一个新的视角,通过清晰半径的引入改进了协同聚类的效果,为后续的聚类算法设计提供了有价值的参考。同时,这也对模式识别和生物信息学等领域中数据分类和分析的工作带来了潜在的改进方案。