关联信息增强的局部相似性K-means谱聚类算法

需积分: 9 0 下载量 193 浏览量 更新于2024-08-11 收藏 298KB PDF 举报
"这篇论文是2013年发表在《西安理工大学学报》上的科研成果,主要讨论了一种基于局部相似性的K-means谱聚类算法,旨在改进社区发现的过程,尤其针对局部相似性指数的计算进行了优化。研究者在传统Sørensen局部相似性指数的基础上,融合了节点对的关联信息,以更准确地评估网络中节点的相似性。他们提出的算法在保持计算复杂性不变的同时,提高了识别网络社团结构的效率和准确性。实验在计算机生成和真实网络上进行,结果表明新算法相比经典方法有显著优势。该论文的关键词包括局部相似性、谱聚类和K-means聚类,属于自然科学领域的论文,分类号为TP15,文献标志码为A。" 在这篇论文中,作者探讨了在社会网络分析和数据挖掘中一个关键的问题——如何有效地识别和划分网络中的社区结构。传统的局部相似性指数,如Sørensen指数,通常只基于共享邻居来衡量两个节点的相似度,这可能导致直接相连的节点之间的相似度被低估。为了解决这个问题,研究者提出了一种新的局部相似性指数,它考虑了节点对之间的关联信息,从而提供了一个更为全面的相似性评估。 K-means算法是一种广泛应用的聚类方法,它通过迭代寻找数据的最佳分割,使得同一簇内的数据点间距离最小,不同簇间的距离最大。然而,当应用于复杂网络时,K-means可能会因为忽略了网络的结构信息而表现不佳。谱聚类则通过考虑网络的连通性来改善这一点,它利用图的拉普拉斯矩阵进行聚类,能够更好地捕捉网络的拓扑特性。 论文将新定义的局部相似性指数与K-means聚类相结合,形成了一种谱聚类算法,这种结合不仅保留了局部相似性指数的计算效率,还增强了聚类的精确性和效果。实验结果证明,这种方法在检测和划分网络社区时,无论是对于人工生成的网络还是真实的网络数据,都表现出优越的性能,能够更加准确地揭示网络内部的结构和群体特征。 这篇论文为网络分析提供了一个创新的工具,有助于更深入地理解和探索复杂网络的组织规律,对于社会网络分析、信息检索、生物信息学等领域具有重要的理论和实践意义。