优化的特征加权模糊混合聚类算法:实证与应用

需积分: 3 1 下载量 7 浏览量 更新于2024-09-06 1 收藏 256KB PDF 举报
特征加权的模糊混合目标聚类算法是针对复杂数据集的一种高级聚类技术,由陈新泉在其研究中提出。该算法融合了Fuzzy C-Means (FCM) 聚类算法与特征权重的最优化策略,旨在解决同时包含有序属性类型和无序类别属性的数据点集的聚类问题。FCM算法原本是一种基于隶属度的非监督学习方法,通过模糊集合理论将数据点分配到多个类别的可能性上。 在该论文中,作者首先对FCM的基本迭代公式进行了扩展,引入了特征权重的概念,以期优化目标函数。这个优化过程涉及到寻找每个特征对聚类结果的贡献程度,使得数据点的聚类更加精确,特别是对于那些在不同类别间具有重要区分作用的特征。特征权重的最优化通过调整每个特征在目标函数中的影响力,提高了聚类的针对性和有效性。 论文强调了特征权重最优化与传统数据分析方法(如主成分分析、因子分析和独立成分分析)的区别。传统的特征选择方法,如过滤方法,可能存在可分性判据单调性不足的问题,而包装方法虽然能提供更直接的分类效果评估,但计算成本较高。相比之下,特征加权的模糊混合目标聚类算法试图在保持计算效率的同时,提升聚类质量。 作者通过Iris数据集的仿真实验,展示了特征权重对聚类结果的重要影响,即不同的目标函数权重会导致不同的聚类效果。此外,通过德国数据集的实验,证明了对于复杂分布的数据集,使用多于实际分类数目的聚类数量可以更好地揭示数据的内在结构,进一步验证了算法的有效性。 陈新泉的研究提供了一种创新的方法,将特征权重优化融入FCM算法,使得在处理多元属性且类别属性各异的数据时,能够更准确地进行聚类分析。这对于实际数据挖掘和机器学习任务具有重要意义,特别是在处理高维和复杂数据集时,可以显著提高聚类的准确性和解释性。