改进粒计算的K-medoids聚类算法优化研究

需积分: 9 0 下载量 31 浏览量 更新于2024-08-12 收藏 353KB PDF 举报
"这篇论文是2014年发表在《计算机应用》期刊上的一篇研究,由潘楚和罗可撰写,主要讨论了对K-medoids聚类算法的改进,利用粒计算方法提高聚类效率和精度。" 在传统的K-medoids聚类算法中,存在几个关键问题,如对初始聚类中心的选择敏感、收敛速度慢以及聚类结果的精度不高。为了克服这些不足,论文提出了一种新的算法,该算法结合了改进的粒计算、粒度迭代搜索策略和优化的适应度函数。 首先,改进的粒计算思想被用于从有效粒子集合中选择出K个密度较大且彼此间距离较远的粒子。这样的选择策略有助于找到更具有代表性的初始聚类中心,从而减少算法对初始中心选取的依赖性,提高聚类稳定性。 其次,论文引入了粒度迭代搜索策略。在对应的K个有效粒子中,算法不仅选择中心点,还动态地更新这些中心点,这有助于快速找到最优解,从而减少迭代次数,提高算法的运行效率。 再者,优化的适应度函数是通过结合类间距离和类内距离来实现的。类间距离衡量不同类别间的差异,而类内距离则反映同一类别内部的相似性。优化的适应度函数能够更好地平衡这两个因素,使得聚类结果更加紧凑,提高聚类的精度和稳定性。 通过在UCI标准数据集上的实验,新算法验证了其在减少迭代次数的同时能显著提升聚类准确率。这表明该方法对于大数据集的处理具有较高的实用价值,特别是在需要快速准确聚类的场景中。 关键词涉及的领域包括K-medoids聚类算法(一种基于对象的聚类方法,以寻找代表性的“medoid”或“典型对象”作为类别的中心),粒计算(一种处理复杂信息的计算模型,允许在不同粒度级别上操作和决策),粒度迭代搜索策略(在解决问题时,通过改变粒度级别来寻找最佳解的方法),以及优化适应度函数(在进化算法或遗传算法中,用于评估解决方案质量的函数)。 这篇论文的贡献在于提供了一个改进的K-medoids聚类算法,它通过引入粒计算的理论和策略,改善了传统算法的性能,为数据挖掘和机器学习领域的聚类问题提供了新的解决思路。