改进的WFCM聚类算法:特征权重与FCM融合

需积分: 18 2 下载量 113 浏览量 更新于2024-07-17 收藏 314KB PDF 举报
本文主要探讨的是"特征加权的模糊C聚类算法",由作者陈新泉,来自华南理工大学计算机科学与工程学院。该研究着重于将FCM(模糊C均值聚类算法)与特征权重的最优化策略相结合,以提高聚类的性能。传统的特征选择方法,如过滤法和包装法,存在可分性判据缺乏递增性的问题,这使得特征权重的优化成为一项挑战。 文章首先推导出了一种优化迭代公式,该公式将FCM的聚类过程与特征权重的最优化紧密结合。通过将计算中心平均点的公式嵌入到隶属度的更新和特征权重的更新过程中,创建了一个名为WFCM(加权模糊C聚类算法)的扩展版本。这种算法特别适用于同时包含有序属性类型和无序类别属性类型的数据集,能够处理复杂的数据分布。 通过Iris数据集的仿真实验,WFCM算法显示出优于传统FCM算法的聚类效果。对于具有有序和无序属性的German数据集,实验表明采用多于类别数目的聚类数可以得到更好的结果,进一步证实了算法的有效性。与Joshua Zhexue Huang等人的工作类似,但作者提出的方法针对的是模糊C均值聚类,并提供了具体的算法实现和分析。 总结来说,本文的主要贡献在于提出了一种创新的特征加权模糊C聚类方法,旨在解决特征选择和权重优化问题,从而提升数据挖掘中的聚类性能,特别适用于不同类型数据的处理。这种方法在实际应用中展示了其优越性,并通过实验验证了其有效性。