语义重叠社区发现:标签传播算法新应用

需积分: 0 0 下载量 166 浏览量 更新于2024-08-05 收藏 1.44MB PDF 举报
"这篇文章是关于基于标签传播的语义重叠社区发现算法的研究,由辛宇、杨静和谢志强三位作者在2014年的《自动化学报》上发表。他们提出了一种新的方法来解决语义社会网络中的社区发现问题,特别是处理节点之间的语义重叠情况。" 文章详细内容: 语义社会网络(SSN)是网络的一种新形式,它由信息节点和链接关系组成,与传统的社会网络不同,SSN的复杂性使得基于邻接关系的社区发现算法难以有效处理语义重叠问题。为了解决这个问题,作者提出了基于标签传播的语义重叠社区发现算法。 该算法的核心是利用LDA(潜在狄利克雷分配)模型作为语义信息模型。LDA是一种统计模型,常用于主题建模,通过Gibbs取样法,将节点的语义信息映射到一个定量的语义空间。这样可以捕捉节点间的语义关联性。 为了衡量节点间的相似性,作者提出了主成分(SCNP,Semantic coherent neighborhood propinquity)模型。SCNP模型能够度量节点在语义空间中的邻近程度,从而作为标签传播过程中的权重。同时,他们还引入了语义影响力(SI,Semantic impact)模型,用以确定传播过程中的截断阈值,以控制信息传播的程度。 在此基础上,他们对经典的LPA(标签传播算法)进行了改进,创建了Semantic-LPA,这是一种针对语义重叠社区的优化版本。Semantic-LPA结合了SCNP的权重和SI的截断参数,能更精确地识别和分割社区结构。 为了评估算法的效果,作者还提出了语义模块度(Semantic modularity)模型,这是一个衡量社区发现结果质量的指标。通过实验分析,他们证明了所提出的算法和语义模块度模型的有效性和可行性。 关键词涵盖了语义社会网络、重叠社区、LDA模型以及标签传播算法,表明这些是文章研究的关键点。文章引用格式给出了完整的参考文献信息,方便后续研究者引用。 这篇文章提供了一种创新的方法,通过标签传播来发现语义社会网络中的重叠社区,对于理解和处理复杂网络中的语义信息具有重要意义。