改进磷虾群算法与KHM聚类融合的混合聚类方法

3 下载量 127 浏览量 更新于2024-08-29 2 收藏 461KB PDF 举报
"该文提出了一种结合改进磷虾群算法和K-Harmonic Means (KHM)聚类的混合数据聚类算法,旨在解决K-means算法对初始聚类中心敏感以及容易陷入局部最优的问题。改进的磷虾群算法通过引入莱维飞行和交叉算子来提高其搜索效率和全局优化能力。实验结果证明了改进算法在找到全局最优解方面的优越性,并且在实际数据集上,与KHM聚类相结合的混合算法表现出更好的聚类性能和全局收敛性。" 本文主要关注的是聚类算法的改进,特别是针对K-means算法的局限性进行了优化。首先,K-means算法是一种广泛应用的中心导向的迭代聚类方法,它依赖于初始聚类中心的选择,一旦选择不当,可能会导致较差的聚类结果或陷入局部最优。为了解决这个问题,作者提出了一种结合改进磷虾群算法(Krill Herd Algorithm, KHA)和K-Harmonic Means的混合策略。 磷虾群算法是一种模仿磷虾群体行为的全局优化算法,但原始版本存在易陷入局部最优和搜索效率低下的问题。为了改善这些缺点,文章引入了莱维飞行和交叉算子。莱维飞行是模拟生物运动的一种方式,可以引导算法跳出局部最优,实现更广泛的搜索;而交叉算子则能促进种群多样性的保持,增加算法的探索能力。实验结果表明,经过改进的磷虾群算法在20个标准测试函数上表现出了更强的全局优化能力和稳定性。 接着,作者将这种优化后的磷虾群算法与K-Harmonic Means聚类算法相结合。KHM聚类是对K-means的扩展,考虑了每个点到所有聚类中心的距离,而非仅考虑最近的中心,因此在处理非凸和不规则形状的聚类时可能更为有效。在每次迭代过程中,他们用改进磷虾群算法找到的最优个体或经过KHM迭代后的新个体来替换最差的聚类中心,这有助于算法避免对初始条件的过度依赖,并增强全局收敛性。 通过在5个UCI真实数据集上的实验,融合了改进磷虾群算法和KHM的混合聚类算法展示了其优势,不仅克服了K-means对初始聚类中心敏感的问题,还显示出了较强的全局收敛性,这意味着它能在较少的迭代次数内得到更优的聚类结果。 此外,文章还提到了其他几种改进聚类算法的研究,如基于目标特征选择和去除的K-means、改进的灰狼优化算法用于高维函数和模糊C均值(FCM)优化、基于改进人工蜂群算法的K-means以及基于边界区域局部模糊增强的πRKM聚类算法等,这些都体现了在聚类领域持续的创新和优化努力。 这篇文章介绍的混合聚类算法提供了一个有效的工具,特别是在面对复杂数据分布时,能够更好地进行聚类分析,对于数据挖掘和机器学习领域的研究具有重要的参考价值。