核模糊C均值聚类有效性:Xie-Beni指标的优化应用

需积分: 9 1 下载量 71 浏览量 更新于2024-08-11 1 收藏 433KB PDF 举报
本文主要探讨了核模糊C均值(Kernelized Fuzzy C-Means, KFCM)算法在高维数据集上的聚类有效性评估问题。KFCM是一种基于核方法的扩展聚类算法,它利用核函数将原始数据映射到高维特征空间,以便处理非线性和非欧几里得结构的数据。在传统的Fuzzy C-Means (FCM)算法基础上,作者提出了将六个经典的有效性指标(如Calinski-Harabasz指数、Davies-Bouldin指数、Silhouette指数等)扩展到高维特征空间的方法,从而获得核化的形式。 研究者通过数值比较实验,深入分析了这些核化指标在高维环境下的性能,以及它们对关键参数如高斯核宽度β(决定核函数的平滑程度)和模糊指数m(控制数据点对聚类中心的隶属度)的敏感性。实验结果显示,核化版本的Xie-Beni指标VxB及其改进指标Vk表现出最优的性能和稳定性,能够更准确地反映KFCM聚类结果的质量。这表明在评估KFCM聚类的有效性时,使用核化Xie-Beni或Vk指标可能比其他指标更为可靠。 因此,对于那些需要处理复杂非线性数据,且希望得到准确聚类效果的场景,核模糊C均值算法结合核化Xie-Beni或Vk指标可以作为一个有效的聚类有效性准则。这不仅有助于提高聚类的准确性,也能为实际应用中的KFCM算法选择最佳参数提供指导。本文的研究为核模糊C均值算法在实际工程中的应用提供了有力的支持和理论依据。