粒子群优化的粗糙核聚类算法研究

需积分: 5 0 下载量 199 浏览量 更新于2024-08-13 收藏 1.18MB PDF 举报
"基于粒子群的粗糙核聚类算法 (2012年),姚丽娟,罗可,长沙理工大学计算机与通信工程学院" 本文主要介绍了一种针对K-means聚类算法缺陷的改进方法——基于粒子群的粗糙核聚类算法。K-means算法在处理聚类问题时,存在几个显著的问题:容易陷入局部最优,无法有效地处理边界对象,以及对于线性不可分的数据集无能为力。为了解决这些问题,作者提出了将粒子群优化(PSO)算法与粗糙集理论以及核函数相结合的新方法。 首先,该算法利用Mercer核函数,如高斯核或多项式核,将原始样本空间中的数据映射到一个高维特征空间。这一过程使得原本在低维空间中非线性可分的数据在高维空间中变得线性可分,从而增强了聚类的能力。 接着,引入粗糙集理论来处理边界对象。粗糙集理论允许不精确和不确定性的处理,通过动态调整上下近似集的权重因子,可以更有效地处理那些位于不同类别边缘的模糊样本,避免它们对聚类结果的影响。 为了应对混合类型的数据,文章采用了reliefF算法对样本属性进行加权。reliefF是一种特征选择方法,它根据特征与类别之间的关系来赋亞性质不同的权重,有助于识别和处理不同类型的数据,提高聚类的准确性。 最后,通过粒子群优化算法来指导聚类过程,粒子群优化具有全局搜索能力,可以避免算法过早收敛到局部最优,提高聚类的全局优化性能。粒子群中的每个粒子代表一个可能的聚类中心,通过迭代和信息交换,粒子群能够寻找全局最优解。 实验结果显示,该算法在正确率和收敛速度上优于其他改进的聚类算法,证明了其鲁棒性和稳定性。因此,这种基于粒子群的粗糙核聚类算法对于解决复杂聚类问题具有较高的实用价值,特别适用于处理包含边界对象和混合类型数据的聚类任务。 关键词:聚类;核函数;粗糙集;粒子群算法;属性加权 总结起来,这篇文章提供了一种创新的聚类方法,它结合了核函数的线性化能力、粗糙集的边界处理机制、reliefF的属性权重计算以及粒子群的全局优化特性,克服了传统K-means算法的局限,提高了聚类的准确性和效率。