改进Neural-Gas的高效聚类算法CARD:性能超越K-means

需积分: 14 1 下载量 160 浏览量 更新于2024-09-08 收藏 1.42MB PDF 举报
本文研究的是一篇关于改进Neural-Gas算法的聚类新算法——CARD的论文。Neural-Gas算法是一种基于神经网络的非参数聚类算法,其原始版本依赖于连接权重的动态调整来构建自组织的神经网络结构,用于数据的分群。然而,这篇论文提出了一种创新的方法,将点对簇质心的影响与距离值的具体数值而非仅仅顺序关联起来。具体来说,作者引入了对邻近簇质心距离的考虑,这意味着一个点对某个簇的影响不仅取决于它与该簇中心的距离,还会受到其他更接近簇的影响。 在算法改进中,作者可能采用了一种动态计算机制,通过比较当前点与所有其他簇质心之间的距离,然后根据这些距离值的大小,确定每个点对各个簇的贡献程度。这种策略有助于避免因单一距离度量导致的聚类偏见,并且在实践中可能导致更好的聚类效果。 实验部分展示了CARD算法在多个数据集上的性能评估,包括熵、纯度、F1值、rand index(随机指数)和规范化互信息NMI等关键聚类评价指标。结果显示,与传统的K-means算法和原始的Neural-Gas算法相比,CARD算法在这些指标上表现更优,这表明其在聚类的准确性、稳定性以及效率方面具有显著优势。 此外,论文还提到了该研究得到了国家自然科学基金青年资助项目的支持,作者团队由讲师朱烨行、副教授李艳玲和工程师杨献文组成,他们的研究领域均集中在数据挖掘上。他们的合作反映了在理论研究与实际应用之间的紧密联系,旨在推动聚类算法在实际问题中的应用和发展。 该论文的主要贡献在于提出了一种改进的Neural-Gas聚类算法,它通过考虑距离值的精确数值而非仅依据排序,提高了聚类的质量和效率。这对于数据挖掘和机器学习领域的研究者而言,是一项重要的技术创新,有助于优化数据的自动分类过程。