融合拓扑结构与属性的重叠社区检测算法

需积分: 37 3 下载量 55 浏览量 更新于2024-09-07 2 收藏 1.67MB PDF 举报
"这篇论文提出了一种新的重叠社区检测算法,该算法结合了节点的拓扑结构和属性信息,以解决传统方法忽视节点属性导致的数据结构遗漏问题。通过使用余弦相似度来计算节点与局部社区之间的相似度,提高了搜索效率,并改进了局部模块度增量计算方法,使算法能发现潜在的社区。最后,通过融合多个局部社区来构建全局重叠社区结构,并在实际数据集上进行了实验验证,表明该算法在模块度和F1-measure指标上有良好表现,尤其适合稀疏网络。" 论文探讨的核心是重叠社区检测,这是社交网络分析中的一个重要领域,旨在识别网络中可能存在交集的社群。传统的社区检测算法通常只关注节点间的连接关系(即拓扑结构),而忽略节点的属性信息,这可能导致对网络结构的理解不完整。论文提出的算法引入了节点的属性相似度,以弥补这一不足。 具体实现中,算法首先利用余弦相似度作为度量标准,评估节点与潜在社区的相似程度,这有助于快速筛选出可能属于同一社区的节点,提高了局部搜索的效率。接着,通过对局部模块度的增量计算方法进行优化,使得算法在迭代过程中能逐渐接近真实的社区结构,减少了虚假社区的出现。 在社区检测过程中,算法将多个已检测到的局部社区融合,生成一个全局的重叠社区结构。这种融合过程通过隶属矩阵来表示,矩阵的每个元素表示节点对各个社区的归属程度,从而能够全面反映节点在不同社区中的分布情况。 实验部分,该算法与仅基于拓扑结构的社区检测方法进行了比较,实验结果证明了新算法在模块度和F1-measure两个关键性能指标上的优势。模块度是衡量社区结构质量的一个标准,F1-measure则反映了检测结果的精确性和召回率。在稀疏网络中,新算法表现尤为出色,表明它更能适应现实世界中大量存在稀疏连接的网络环境。 总结来说,这篇研究提供了一种新颖的重叠社区检测策略,结合了节点的拓扑和属性信息,提高了检测的准确性和效率,对于理解和分析复杂网络结构具有重要的理论和应用价值。