收稿日期:20181016;修回日期:20181212 基金项目:国家自然科学基金资助项目(11461063)
作者简介:许英(1981),女,新疆乌鲁木齐人,副教授,博士,主要研究方向为复杂网络理论及其应用(xuyingyjy@163.com).
利用改进蚁群算法的重叠社团检测分析方法
许 英
(新疆财经大学 应用数学学院,乌鲁木齐 830012)
摘 要:针对重叠社团检测准确率提升问题,提出了一种基于改进蚁群算法的新型重叠社团检测算法。该算法
包含位置初始化、运动和后处理三个阶段,分别通过初始位置识别与标签列表存储、基于节点间相似度的启发式
信息重定义、合作保持标签列表等方式,使算法在合成数据集与现实世界数据集中的重叠社团与节点检测方面
具有更好的性能。实验结果表明,在合成网络与现实世界网络平台上使用不同检测算法,提出方法对重叠社团
与重叠节点的检测准确率较传统检测方法更高,因而对重叠社区检测问题求解与理解网络功能结构具有重要的
参考与借鉴意义。
关键词:重叠社团与节点检测;改进蚁群算法;启发式信息重定义;标签列表迭代更新
中图分类号:TP301.6 文献标志码:A 文章编号:10013695(2020)05018137505
doi
:10.19734/j.issn.10013695.2018.10.0803
Novelalgorithmofoverlappingcommunitydetectionand
analysiswithimprovedantcolonyalgorithm
XuYing
(SchoolofAppliedMathematics,XinjiangUniversityofFinance&Economics,Urumqi830012,China)
Abstract:Thispaperproposedanewdetectionalgorithm foroverlappingcommunitiesbasedonantcolonyalgorithmtoim
provethedetectionaccuracyofoverlappingcommunities.Thealgorithmconsistedofthreestages:positioninitialization,mo
tionandpostprocessing.Thealgorithmachievedbetterperformanceofoverlappingcommunitiesandoverlappingnodesdetec
tioninsyntheticdatasetsandrealworlddatasetsthroughinitialpositionidentificationandtagliststorage,heuristicinformation
redefinitionbasedonsimilaritybetweennodes,andcooperativetaglistpreservation.Thedetectionperformanceofdifferentde
tectionalgorithmsonsyntheticandrealworldnetworkplatformsshowsthattheproposedmethodbasedonimprovedantcolony
algorithmhasgoodaccuracyandanalysisperformance.Themethodcanbeusedforreferenceinsolvingthecurrentoverlapping
communitydetectionproblemandunderstandingthefunctionalstructureofthenetwork.
Keywords:overlappingcommunityandnodedetection;improvedantcolonyalgorithm;heuristicinformationredefinition;
taglistiterativelyupdate
0 引言
社团定义为网络结构中依据具备共享属性的顶点
[1]
。类
似于社会网络中一个人具有不同角色,在标准化网络分区中,
分区中每个顶点被分配给一个社团
[2]
,且被社团之间共享;此
外,由于不同节点在网络结构和功能上具有不同作用,所以检
测网络中的重叠社团可更深入地了解网络的功能与结构。因
此,近年来重叠社团检测研究已引起学术界极大关注。众多具
备良好分析性能的算法相继提出,并广泛应用于延迟容忍网
络
[3,4]
、推荐系统
[5]
等领域。
当前社团检测算法大致可分为五类
[6]
,即派系过滤算法
(cliquepercolationmethod,CPM)、局部扩展和优化算法、链接
分区算法、模糊检测算法和基于代理的算法。文献[7]将索引
局部邻接表示法引入社团检测时的个体表示中,将社团结构分
析转换为整数优化问题,并据此提出基于差分进化的社团检测
算法;文献[8]基于群体智能思想提出一种自组织的重叠社团
结构分析算法,但智能体间收敛精度对检测性能影响较大;文
献[9]从有效融合两类不同的异质信息研究出发,提出了一种
基于交互行为和连接分析的社交网络社团检测方法,但检测性
能很大程度上依赖于数据属性;文献[10]提出一种局部优先
的动态网络重叠社团演化分析方法,但其全局最优性有待验
证;文献[11]提出了一种使用最优特征向量的谱二分社团检
测方法,在上述重叠社团检测算法中,虽然可以一定程度地解
决重叠社区检测分析问题,但均忽略了迭代过程中节点标签变
更对检测性能的影响。借鉴蚁群算法中信息素更新与运动路
径选择策略,本文提出一种基于改进蚁群算法的重叠社区检测
算法(antcolonybasedalgorithm,AntCBO)。在建立基于蚁群算
法的重叠社团检测框架基础上,通过基于节点间相似度的启发
式信息重定义与基于标签列表更新存储的蚁群路径选择两个
环节实现重叠社团检测,在合成数据集和现实世界数据集上检
测算法性能分析。
1 AntCBO重叠社区检测算法基本架构
网络抽象可建模为无向图 G=(V,E),其中 V、E分别为节
点与边集合。设每个节点 v都具有唯一标签 l
v
,并记 N(v)为
节点 v的邻域。重叠社团检测目的是寻求某种方法,将抽象得
到的无向图 G分割为一系列小集群(C
1
,C
2
,…,C
m
),使每个
集群中具有相同的节点。数学描述为
∪
1
≤
i
≤
m
C
i
=G且
i,j
∈
m,C
i
∩
C
j
≠
(1)
11 算法框架
算法 1 AntCBO算法框架
输入:复杂网络 G=(V,E)。
第 37卷第 5期
2020年 5月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol.37No.5
May2020