第 52卷 第 7期
Vol.52 No.7
山 东 大 学 学 报 (理 学 版)
JournalofShandongUniversity(NaturalScience)
2017年 7月
Jul.2017
收稿日期:20161125;网络出版时间:2017061409∶00
网络出版地址:http://kns.cnki.net/kcms/detail/37.1389.N.20170614.0900.004.html
基金项目:国家自然科学基金资助项目(U1504602);河南省教育厅科学技术研究资助项目(14B520014);河南省科技厅科技计划资助项目
(162102310590);河南省高等学校重点科研资助项目(16A520106);教育教学改革项目资助(J2016037)
作者简介:张中军(1982— ),男,硕士研究生,讲师,研究方向为数据挖掘、大数据、机器学习.Email:suedy521@163.com
文章编号:16719352(2017)07009707 DOI:106040/j.issn.16719352.1.2016007
基于网络距离和内容相似度的
微博社交网络社区划分方法
张中军
1,2
,张文娟
1
,于来行
1,3
,李润川
4,5
(1.周口师范学院计算机科学与技术学院,河南 周口 466001;
2.农产品质量安全追溯技术河南省工程实验室,河南 周口 466001;
3.大连理工大学计算机科学与技术学院,辽宁 大连 116024;
4.郑州大学互联网医疗与健康服务河南省协同创新中心,河南 郑州 450000;
5.郑州大学产业技术研究院,河南 郑州 450000)
摘要:现有的微博社交网络社区挖掘方法多是基于网络结构进行,忽略了节点本身行为的重要性,并且不能同时
实现对大规模复杂网络结构适应性和社区挖掘的高效性。为缓解上述问题,提出了一种基于网络距离和内容相
似度的微博社交网络社区划分方法,该方法在考虑微博社交网络结构的同时兼顾了网络中节点的历史微博内容,
通过对历史微博数据的分析提高社区划分的精确度。文中对 Louvain算法和其模块性的修改使用,保证了该方法
能够处理大规模网络数据,同时又能保证社区挖掘的效率。实验证明,该方法能够高效地挖掘微博网络社区结
构,对学术研究和商业应用都有十分重要的意义。
关键词:微博;社交网络;社区;模块度
中图分类号:TP311 文献标志码:A
引用格式:张中军,张文娟,于来行,等.基于网络距离和内容相似度的微博社交网络社区划分方法[J].山东大学学报(理学版),
2017,52(7):97103.
Acommunitydivisionmethodbasedonnetworkdistanceand
contentsimilarityinmicroblogsocialnetwork
ZHANGZhongjun
1,2
,ZHANGWenjuan
1
,YULaihang
1,3
,LIRunchuan
4,5
(1.SchoolofComputerScienceandTechnologyofZhoukouNormalUniversity,Zhoukou466001,Henan,China;
2.TraceabilityTechnologyofAgriculturalproductsqualityandSafetyEngineeringLaboratoryof
HenanProvincial,Zhoukou466001,Henan,China;
3.SchoolofComputerScienceandTechnologyofDalianUniversityofTechnology,Dalian116024,Liaoning,China;
4.CollaborativeInnovationCenterofInternetMedicalandHealthcareinHenan,Zhengzhou450000,Henan,China;
5.Instituteofindustrialtechnology,ZhengzhouUniversity,Zhengzhou450000,Henan,China)
Abstract:Existingmicroblogsocialnetworkcommunityminingmethodsarebasedonthenetworkstructure,ignoring
theimportanceofnode
sbehavior,andcannotguaranteetheadaptabilityonlargescalecomplexnetworkstructureand
theefficiencyofcommunitymining.Toalleviatetheseproblems,anewmethodABDCisproposedforthecommunity
networkofmicroblogbasedonthenetworkdistanceandcontentsimilarity,themethodconsidersthestructureofthe
socialnetworkofmicroblogatthesametimetakingintoaccountthehistoricalblogcontentofthenodeinthenetwork,
improvedtheaccuracyofcommunitydivisionthroughanalysisthehistoricalmicroblogdata,Inthispaper,theLouvain
algorithm anditsmodularityaremodifiedandusedtoensurethatthemethodcandealwithlargescalenetworkdata,and