第 39 卷第 4 期 电 子 与 信 息 学 报 Vol.39No.4
2017 年 4 月 Journal of Electronics & Information Technology Apr. 2017
一种基于最大熵原理的社交网络用户关系分析模型
肖云鹏
*①
杨 光
①
刘宴兵
①
吴 斌
②
①
(重庆邮电大学网络与信息安全技术重庆市工程实验室 重庆 400065)
②
(北京邮电大学北京市智能通信软件与多媒体重点实验室 北京 100876)
摘 要:在社交网络的演化和发展过程中,用户之间关系的建立受到多种因素的共同作用。该文通过对社交网络中
用户属性以及用户关系数据进行分析,旨在发现影响用户关系建立的关键因素。首先,针对用户关系建立的复杂驱
动因素,分别从个人兴趣、好友关系、社团驱动 3 个方面提取影响用户关系建立的因素并定义相应的影响因子函数。
其次,针对多种影响因素难以量化以及权值分配不确定等问题,以最大熵原理为基础构建用户关系分析模型,该模
型在选择特征时具有不需要依赖于特征之间的关联性等特点,并能够量化各个因素对用户关系建立的驱动强度。从
而挖掘影响链接建立的关键因素,分析用户关系发展态势。实验表明,该模型不仅能够量化各因素对链接建立的驱
动强度,发现关键影响因素,而且可以对用户关系进行有效预测。
关键词:社交网络;用户关系;关系态势;最大熵原理
中图分类号:TP391 文献标识码:A 文章编号:1009-5896(2017)04-0778-07
DOI: 10.11999/JEIT160605
Social Relationship Analysis Model Based on
the Principle of Maximum Entropy
XIAO Yunpeng
①
YANG Guang
①
LIU Yanbing
①
WU Bin
②
①
(Chongqing Engineering Laboratory of Internet and Information Security, Chongqing University of Posts and
Telecommunications, Chongqing 400065, China)
②
(The Intelligent Communication Software and Multimedia Key Laboratory of Beijing, Beijing University of
Posts and Telecommunications, Beijing 100876, China)
Abstract: Within the evolution and development of social networks, the establishment of relationships among the
users is affected by various factors. By analyzing user behavior data and relationship data in social network, this
study tries to detect the key factors that affect the formation of relationship among users. Firstly, considering the
complex driving factors for the user relationship establishment, the factors are extracted and the impact factor
functions are defined from personal attributes, friendships and community driving. Secondly, in order to quantify
driving factors and assign weight, a user relationship analysis model based on the principle of maximum entropy is
proposed. The model is, when choosing features, characterized by its independence from the association among
features, and can also quantify the strength of various factors that drive users to establish relationship.
Furthermore, the key factors that affect the user relationship can be detected and the development trend of user
relationship can be analyzed. Experimental results reveal that the proposal model can not only quantify the
strength of each factor that drives relationship establishment, it can also predict the user relationship effectively.
Key words: Social network; User relationship; Situation analysis; Principle of maximum entropy
1 引言
随着信息技术的不断进步,在线社交网络得到
收稿日期:2016-06-07;改回日期:2016-11-30;网络出版:2017-01-22
*通信作者:肖云鹏 xiaoyp@cqupt.edu.cn
基金项目:国家 973 计划项目(2013CB329606), 国家自然科学基金
(61272400), 重庆市青年人才项目(cstc2013kjrc-qnrc 40004), 教育
部-中国移动研究基金(MCM20130351),重庆市研究生研究与创新
项目(CYS14146),重庆市教委科学计划项目(KJ1500425),重庆邮
电大学文峰基金(WF201403)
Foundation Items: The National 973 Program of China (2013CB
329606), The National Natural Science Foundation of China
(61272400), Chongqing Youth Innovative Talent Project (cstc2013
kjrc-qnrc40004), Ministry of Education of China and China Mobile
Research Fund (MCM20130351), Chongqing Graduate Research
and Innovation Project (CYS14146), Science and Technology Research
Program of the Chongqing Municipal Education Committee
(KJ1500425), WenFeng Foundation of CQUPT (WF201403)
了蓬勃发展,并且逐渐成为人们生活不可或缺的一
部分。在社交网络的研究中,用户关系分析是一个
基础问题,近年来受到各个领域越来越多的关
注
[1,2]
。分析用户关系可以帮助人们更加深刻地了解
网络的演化模式和发展方向,同时相关研究也可以
被广泛地应用于各个领域,例如:电子商务中的商
品推荐,以及生物学领域蛋白质相互作用关系的发
现中,从而产生巨大的经济效益和社会效益。
现阶段对于社交网络中的关系分析,主要有用
户关系强度以及用户关系预测等方面的研究。在用
户关系强度的研究中
[3,4]
,文献[5]运用了监督学习的
方法来预测用户关系强度,该方法可以较好地发现
网络中所存在的强链接。文献[6]则是提出了一个无
监督的模型,该模型可以通过用户的相似度和交互
活动来评估用户的关系强度。文献[7]提出一种基于