基于划分熵的FCCM算法参数优化方法提升聚类稳定性

0 下载量 76 浏览量 更新于2024-09-04 收藏 413KB PDF 举报
FCCM算法(Fuzzy C-Means Clustering)是一种基于模糊集合理论的聚类分析方法,它在处理数据集中的非凸、不规则形状的簇时表现出良好的性能。然而,其效果很大程度上依赖于一个关键参数——模糊控制参数Tu。传统上,这个参数常常通过经验设置或者通过大量的实验调整来确定最优值,这可能导致结果的不稳定性和主观性。 刘永利和付丽丽在他们的研究中认识到,模糊控制参数Tu的选择直接影响到聚类的精确度和聚类结果的清晰度。划分熵是用于评估聚类结果清晰度的一个重要指标,它反映了数据点分配到各个簇的不确定性。他们观察到,随着Tu值的变化,划分熵会有明显的变化,从而提供了调整参数的依据。 为了克服现有方法中的随机性和偶然性,他们提出了一个基于划分熵的参数优选方法。该方法利用隶属度矩阵的平均方差来限制Tu的取值范围,目的是减少聚类过程中的模糊性,确保聚类结果具有更高的稳定性。这种方法通过动态调整参数,使得聚类过程更为合理,减少了人为因素对最终聚类结果的影响。 在他们的实验中,使用这种方法确定的Tu值不仅提高了聚类的准确性,而且显著降低了依赖于个人经验和实验次数的不确定性。结果表明,这种方法能够有效地优化FCCM算法,使其在实际应用中得到更可靠和稳定的聚类结果,这对于数据挖掘、机器学习等领域有着重要的实践价值。 关键词:模糊联合聚类、模糊控制参数、划分熵、聚类算法。刘永利和付丽丽的研究工作在计算机科学与技术领域具有一定的理论贡献,为FCCM算法的参数优化提供了一种创新且实用的方法,有助于提高聚类任务的效率和精度。