挖掘与分析Email社会网络的社区算法:以Enron数据集为例

需积分: 11 7 下载量 11 浏览量 更新于2024-07-24 收藏 2.05MB PDF 举报
本篇硕士学位论文深入探讨了Email社会网络的社群挖掘和分析算法的研究。作者尹盛在计算机应用技术专业背景下,针对互联网技术的飞速发展和Email在日常生活中的广泛应用,提出了基于连接特性的社群挖掘方法。这个研究关注的是如何从海量Email通信数据中提取有价值的信息,以揭示人类社会的社群结构以及成员的重要程度。 论文首先回顾了社会网络中的社群概念,将其与传统社会学中的凝聚子群进行对比,并引入了一个更宽泛的基于连接特性的社群定义。这种定义强调了Email通信网络中个体间的连接关系对于社群识别的重要性。作者设计了一种算法,能够有效地挖掘出社群成员,包括其内部的紧密联系和角色定位。 对于社群成员的重要性评估,论文提出了两种模型:一种是基于社会网络中心性指标的社群核心挖掘模型,它利用节点的中心位置来衡量其在社群中的影响力;另一种则是基于PageRank思想的模型,这种方法借鉴了搜索引擎的算法,能够客观地评价成员在社群中的关键作用。这两种方法为理解社群内的权力结构和信息传播提供了定量依据。 研究者选择了Enron Email数据集作为案例,这是一个被广泛用于社会网络分析领域的经典数据集。通过应用文中提出的数学模型和算法,论文进行了实际的社群挖掘和成员重要性评价实验。实验结果显示,这些方法在处理大规模Email数据时表现出良好的有效性,验证了理论模型的实际应用价值。 此外,论文还提到了关键词,如社会网络分析、数据挖掘、社群挖掘、链接挖掘和Email社会网络,以及安然邮件数据集,这些都是研究的焦点和领域背景。最后,论文的分类号TPl82表明了这是一项关于信息技术和社会学交叉领域的深入研究,具有显著的理论和实践意义。 这篇论文为理解电子邮件通信数据背后的社会结构和成员角色提供了新颖的工具和技术,对执法机关、犯罪侦查以及信息安全等领域具有实际应用价值。通过深入挖掘Email社会网络,可以揭示潜在的犯罪网络、欺诈行为,有助于提升社会治理效能。