主题与链接融合的社团发现算法:提升精度与有效性

需积分: 10 0 下载量 143 浏览量 更新于2024-09-06 1 收藏 558KB PDF 举报
本文研究的论文标题为《基于主题划分和链接划分的社团发现算法》(Community-detection algorithm based on topic division and link division),作者包括欧阳骥、周宪政、卓晓燕和黄翰,分别来自东莞理工学院计算机学院和华南理工大学软件学院。研究发表于2016年的《计算机工程与应用》杂志第52卷第20期,页码为69-74。 传统社团发现算法主要依赖于链接关系来划分社团,这可能导致无法有效地识别非链接关系,从而影响社团划分的精度。为了克服这一问题,研究者提出了一种创新的方法。他们首先认识到节点中的文本信息蕴含着丰富的主题信息,因此通过分析节点文本,提取隐藏的主题信息,来判断社团在主题上的关联性。 研究的核心内容是设计了一个优化的潜在狄利克雷分配模型(Potential Dirichlet Allocation, PDA)。PDA是一种概率图模型,它能够根据文本数据中的主题分布对社团进行主题划分,这有助于更精细地理解社团内部和社团间的主题联系。通过这种方式,社团的内在结构被更好地理解和表达,不仅考虑了链接关系,也考虑了主题的相似性。 接着,研究人员将主题划分的结果与链接划分相结合,应用优化的模块度社团发现算法,对社团进行进一步的细化处理。模块度是一种度量社团紧密程度的指标,优化后的算法能够更准确地识别那些既有紧密链接又有主题关联的社团。 论文还提出了一个针对主题社团的评估方法,用来衡量算法在主题划分和链接划分方面的性能。通过对比实验,作者使用多个数据集对算法在各个阶段的效果进行了验证。实验结果显示,基于主题检测的社团发现算法在主题划分和链接划分方面都表现出了显著的优势,能够有效地提高社团发现的精确性和全面性。 总结来说,这篇论文创新性地引入了主题信息到社团发现算法中,结合了链接关系和主题相关性,从而提高了社团划分的准确性,并通过实证研究证实了该方法的有效性。这对于网络数据分析,特别是在社交网络分析、社区挖掘等领域具有重要的理论和实际价值。