局部近邻传播与用户特征结合的社区识别算法

1 下载量 2 浏览量 更新于2024-08-29 收藏 1.14MB PDF 举报
"该文章是2015年2月发表在《通信学报》上的一篇研究论文,由郭昆、郭文志、邱启荣和张歧山共同撰写,探讨了一种结合局部近邻传播和用户特征的社区识别算法。该算法旨在解决社交网络中的社区检测问题,尤其针对节点关联信息不完整的场景。" 本文主要介绍了一种新的社区识别算法,该算法融合了局部近邻传播与用户特征的相似性测度。社区识别在社交网络分析中扮演着至关重要的角色,因为社区结构能够揭示用户之间的紧密联系和兴趣群组。传统的社区识别方法往往侧重于网络拓扑结构,而忽视了用户特征信息。 局部近邻传播算法是一种基于消息传递的聚类方法,它通过节点之间的相似度进行信息传播,最终形成稳定的聚类。然而,这种算法在大规模社交网络中可能面临时间和空间复杂度高的挑战。为了优化这一问题,该论文提出的算法首先放松了代表点的约束条件,并限制消息仅在节点的局部近邻之间传播。这样的改进使得算法在保持较高识别精度的同时,降低了计算复杂度。 此外,针对社交网络数据中用户关联信息不完整的情况,该算法引入了节点的特征相似度。通过将拓扑相似度(即节点间的连接关系)与特征相似度(如用户的兴趣、行为等)相结合,构建了综合相似度度量。这种方法使得算法在缺乏边信息的情况下依然能有效识别社区结构。 实验部分,作者在人工数据集和真实社交网络数据集上进行了对比实验,结果显示,新提出的算法具有近似线性的时间复杂度和线性空间复杂度,即使在网络中节点关联边信息不完整时,也能保持良好的识别精度。这些结果证明了该算法在处理大规模社交网络社区识别问题时的高效性和鲁棒性。 关键词涵盖了社交网络、近邻传播、社区识别和聚类,表明该研究关注的核心领域和技术手段。中图分类号TP393则将其归类为计算机科学与技术领域,文献标识码A则表示这是一篇原创性的学术研究文章。 这篇论文提出了一种创新的社区识别算法,通过结合局部近邻传播与用户特征,解决了社交网络社区检测中的关键问题,提高了在复杂网络环境下的性能。这项工作对于理解和挖掘社交网络数据,以及推动相关领域的研究具有重要意义。