社交网络中的兴趣影响传播：UltRank模型评估与竞争性网络覆盖的研究

91 浏览量更新于2024-01-16 收藏 1.19MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

沙特国王大学学报社交网络中的影响力传播：基于网络的社区排名模型努兰·艾曼河Abd Al-Azim，Tarek F.GharibAl-Gharib，Mohamed Hamdy，Yasmine Afify信息系统系，计算机和信息科学学院，艾因夏姆斯大学，11566开罗，埃及阿提奇莱因福奥文章历史记录：收到2020年2020年8月5日修订2020年8月6日接受在线预订2020年保留字：影响力传播社交网络分析图挖掘社区排名最终排名A B S T R A C T社交网络中内容传播的驱动力是用户对内容的兴趣，这种兴趣强烈地反映在他们的显然，用户的兴趣随着传播的内容而变化。因此，动态兴趣导致将SN分解成动态用户簇这项工作的目的是排名基于兴趣的社区使用影响力传播。这项工作的concerns是三个方面：第一，突出的意义，间接影响之间的兴趣为基础的用户群体。二是研究其对内容传播能力的影响第三，提出了一个最终的排名模型（UltRank），唯一地考虑直接和间接的影响，反映在一个新的可达性度量，考虑：1。利益集团之间的距离。2.可接触兴趣组的百分比3.第三章。可访问节点的百分比UltRank模型已在综合实验中进行了评价首先，从聚类质量的角度来看，所识别的兴趣组的Silhouette系数平均为0.996，97%的不同兴趣组成员的Jaccard第二，排名能力方面，UltRank模型可以对SN中高达91%的利益群体进行排名。最后，从排名有效性的角度来看，UltRank排名列表与其他基准方法相比具有竞争性的网络覆盖结果©2020作者由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍Facebook和Twitter等社交网络在我们的日常生活中发挥着重要作用。用户使用SN来表达他们的意见，分享他们的观点，并与其他同行用户进行交流。此外，营销人员和不同的组织使用SN来服务于其业务目的，这需要持续监控不同用户的行为。这被称为口碑效应（WoM）（Saxena和Saxena，2019; Razaque等人，2019; Tabassum等人，2018年; Li等人， 2018年）。由于SN用户与传播内容的交互，WoM保证SN用户之间的内容扩散（Razaque*通讯作者。电子邮件地址： nouran_ayman@cis.asu.edu.eg （ N. 艾曼河 Abd Al-Azim ），tfgharib@cis.asu.edu.eg （ T.F.Gharib ）， m. cis.asu.edu.eg （ M.Hamdy ），yasmine. cis.asu.edu.eg（Y. Afify）。沙特国王大学负责同行审查例如，2019年）。这些交互取决于用户对内容的兴趣程度。因此，具有相同偏好的用户倾向于彼此更多地交互，从而导致扩散的内容（Ayman等人， 2019年）。对内容传播方向的分析揭示了传播过程后网络结构的关键知识。观察到用户对传播内容的兴趣程度的多样性这种网络结构的使用促进了SN用户到基于内容的社区的聚类因此，用户兴趣在将SN用户聚类到称为兴趣组的动态的基于兴趣的社区中占优势（Ayman等人，2020年）。对利益集团之间的内容流向及其相互影响的研究可用于许多有益的应用，如病毒式营销、舆论监测和推荐系统（Bedi和Sharma，2016年; Yu等人，2016; Zareie等人，2018; Zareie等人， 2019年）。对最先进方法的调查强调了以下观察结果：最终排名是一个社区级别的问题，旨在根据不同因素（如社区成员的群体规模和影响力水平）对用户群体进行排序（Belák等人，2012年;Chen等人，2016年; Li等人， 2017年）;相同兴趣的用户倾向于https://doi.org/10.1016/j.jksuci.2020.08.0041319-1578/©2020作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。制作和主办：Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页：www.sciencedirect.comN. 艾曼河Abd Al-Azim等人沙特国王大学学报2232用户之间的交互性更强;用户兴趣随传播内容的变化而动态变化;兴趣组内部特征的使用，如成员数量或密度，并不能反映其在内容传播中的真实贡献;最后，用户兴趣对用户聚类的影响没有得到应有的重视。同一网络的兴趣组根据用户对传播内容的兴趣而不同在将SN个用户聚类为互不相交的兴趣组之后，存在一些不属于任何已建立的组但将不同的组链接在一起的用户这些用户在将内容从一个组传输到另一个组中起着重要作用，以下这些用户将被称为桥节点。因此，兴趣组是不相交的组，但它们不是断开的，内容可以通过桥节点容易地从一个组流到另一个组它们保证了组之间内容流的连续性。通过对利益集团在网络中影响力的分析，揭示了利益集团对SN传播内容的影响。内容通过桥节点从一个组传播到另一组指示从第一组到另一组的影响流。因此，可以基于群组的影响力对群组进行排名。利益集团的影响可以分为直接影响和间接影响两种。直接影响揭示了内容直接从一个利益集团流向另一个利益集团。另一方面，间接影响表明内容从一个兴趣组传播，并通过一些桥节点，直到到达其他兴趣组。桥节点保证了SN中兴趣组之间内容流的连续性。为了方便不同兴趣群体之间的学习内容流动，提出了一种新的图结构。摘要图由桥节点、摘要兴趣组（其中每个兴趣组被表示为单个节点）和它们之间的内容流方向构成。本文的独特之处在于，通过将社区的内部特征与外部特征相结合，基于用户影响力传播和用户兴趣来解决SN中本文旨在提出一个基于兴趣的社区排名模型，综合社区之间的直接和间接的这些类型的影响被转化为兴趣组以最小距离向分散在最大数量的兴趣组中的最大数量的SN用户传播内容的能力在此基础上，提出了一种基于兴趣的最终排名模型（UltRank模型）。特定利益群体的内容传播功能（可达性）主要体现在三个方面：1.利益集团与其他利益集团之间的距离，体现了利益集团在网络中的中心地位。2.指定兴趣组与可访问组相比的大小。3.可访问的兴趣组数相对于SN中兴趣组总数的比例。基于兴趣的社区排名和SN用户交互分析背后的动机是其在许多日常生活应用中的重要性，例如病毒式营销应用，其中营销人员可以容易地识别和排名他们的目标社区，并作为回报识别和排名他们的目标客户。此外，这种排名的显着影响推荐系统的应用程序中，用户的兴趣发挥了有效的作用，在项目的探索和推荐。本文的结构安排如下：第二部分对相关工作进行了综述第3节介绍了所提出的模型的重要第4节介绍了所提出的模型的细节。第5节给出了验证所提出的模型的有效性的实验，第6节包括结论和未来的工作。2. 相关工作在这一部分中，社区检测和社区排序的方法在SN进行了广泛的调查。社区检测和排序方法可以分为两大类：静态方法和动态方法。在静态方法中，静态特征用于社区排名。这些特征对于时间是不变的和稳定的，例如追随和友谊。另一方面，动态方法考虑用户交互和兴趣的快速变化。这些交互是用户回复、转推、评论、分享等。2.1. 社区检测2.1.1. 静态方法在He等人（2014）和Liu等人（2016）中，提出了两种依赖于标签传播方法（LPA）的方法。在He et al. （2014），LPA与PageRank集成，而在Liu等人（2016）中，LPA与H-index相结合。Liu和Ma（2019）提出了一种新的划分和聚集（DA）算法，用于SN中的社区检测。它采用两个步骤：1。基于节点的相似性将网络划分为小的组。2.将一个团体与另一个团体合并，直到社区的呼声稳定下来。新的相似性指数CAA捕获本地和全球的索引。在Jokar和Mosleh（2019）中，提出了一种新的基于平衡链路密度的标签传播（BLDLP），以解决LPA算法的不稳定性和不确定性。BLDLP使用边权重来解决LPA算法的随机标签选择问题在Chaudhary和Singh（2020）中，提出了余弦共享链路方法（CSLM）。CSLM是一种凝聚的自底向上的方法，使用余弦相似性来检测SN中的社区。该方法采用模块度值作为评价社区的优度函数。2.1.2. 动态方法在Zhang和Yu（2015）中，提出了一种通过提供新的节点接近度定义并从异构网络中收集不同属性来在不同涌现网络中进行社区检测的方法Tiles在Rossetti et al. （2017），这是一种在节点和边缘定期变化的动态网络中发现社区的方法。它考虑到这些变化可能严重影响已发现的社区。在Cruz et al. （2014），引入从社交网络获得的语义信息来提高聚类的质量。在Jiang等人（2019）中，提出了一种新的用户兴趣社区检测（UICD）模型。它将热门用户的兴趣提取出来，减少了无意义的普通用户和兴趣。然后，提出了LPA和协同过滤推荐器来划分兴趣社区。在Zhao等人（2019）中，介绍了一种检测社区的增量方法。它解决了动态SN的挑战。它处理SN中不断添加新的子图的问题在Moscato et al. （2019），提出了一种基于博弈论的社区检测方法。其中社区检测的过程被制定为一个游戏，每个用户的目的是最大化他/她的目标（找到正确的社区）一步一步地执行一组选择。博弈论被用来模拟用户的选择影响其他用户的选择的情况这个过程触发了一个反应，其中用户玩，以最大限度地提高他/她的利益。为了降低在大型社区N. 艾曼河Abd Al-Azim等人沙特国王大学学报2233和SN的动态数据，Singh等人提出了一种新的方法。（2019年）。该方法基于概率数据结构（PDS），保证了数据的快速存取、存储和检索。在Luo et al.（2020）中，提出了一种基于用户交互和级联分析的社区检测新方法。SN中用户的共享行为被捕获并表示为图结构。然后，被称为子事件的用户组的集群被捕获。最后，一个超级图的制定和社区检测进行发现社区，积极相互作用。2.2. 社区排名2.2.1. 静态方法在Rossetti et al. （2016），Asmi et al.（2017），Ding et al.（2018）和Arvind等人（2018）提出了不同的静态方法。这些方法忽略了用户行为的变化和SN的动态性质。在Rossetti et al.（2016）中，对两类社区检测方法进行了比较：最大化社区密度和最大化模块化。它评估了不同的社区检测类别和社会网络的拓扑特征之间的关系。然后考虑它们对地址血友病网络分解问题的影响。在此基础上，提出了一种新的基于公共邻域的相异性度量方法。这项措施旨在找到两个群落之间的边缘（Asmi等人， 2017年）。提出了一种基于核心检测和社区扩展的RTLCD解决了种子依赖问题，通过用目标社区的核心成员替换种子，然后社区扩展发生以基于关系强度扩展检测到的社区核心成员（Ding等人， 2018年）。在Arvind et al. （2018），介绍了一种新的启发式算法。该算法根据用户自定义的属性对SN该函数可以依赖于介数、接近度和程度。所有以前的方法都依赖于静态SN。这意味着SN中的任何更新都将严重影响已发现的社区。因此，引入动态方法来考虑由于用户交互而导致的SN结构的快速变化2.2.2. 动态方法SN的用户和他们的互动的动态性质导致使用博弈论的方法来确定在SN的社区。提出了动态博弈社区发现方法（D-GT）。它将SN用户建模为理性代理，其目标是通过链接或离开社区来最大化其本地效用（Alvari等人， 2016年）。在Cordeiro et al. （2016）和An et al.（2018）提出了不同的动态方法。这些方法主要依赖于用户在SN中的交互。因此，提出了一种新的动态Louvain技术来优化局部模块化，该技术仅针对发生编辑的那些社区最大化模块化增益函数，同时保持网络的其余部分不受影响。（2016年）。在An et al. （2018），提出了一种新的客户细分方法。这种方法依赖于两个步骤：第一，行为细分，根据他们的互动细分客户第二，人口统计细分，根据性别和年龄等人口统计特征对客户进行细分。然后，这两个部分被集成到称为人物角色的一般客户部分。为了解决SN的大规模挑战，导出了新的地理度量聚类方法，该方法C-Tree数据结构用于识别SN中的社区并递增地识别新引入的成员的社区成员资格（Surendran等人， 2016年）。在Moosavi等人（2017）和Chaabani和Akaichi（2017）中，用户之间的内容跟随在用户分解中起着重要作用。提出了一种新的基于频繁模式的方法。这种方法使用用户的交互和内容信息来增强所发现的社区的质量（Moosavi等人，2017年）。介绍了一种新的图挖掘算法--有意义社区检测（MeanCD）MeanCD使用链接重要性函数来衡量用户在共享信息和朋友方面的实力（Chaabani和Akaichi，2017）。社区排名背后的目标Liu等人所（2017）和新的方法，根据其成员的功能排名社区介绍。Liu等人所（2017）提出了一种新的方法。这种方法消除了僵尸粉丝，然后计算用户影响力。然后，结合用户影响力和主题信息传播意愿，最后，通过对用户最终影响力、社会信任度和社区间关系紧密度的综合研究，对社区影响力进行了评价。此外，社区对彼此的影响是使用与其他社区相比的给定社区中节点的成员资格和中心性程度来评估的（Belák等人， 2012年）。提出了一种新的社区模型，称为“k-影响社区”，它基于k-核心的概念，用数值表示分配给节点的影响力。该模型将找到前r个最重要的社区的问题表述为找到r个连接的k-核心子图，这些子图按其重要性的下限排序（Chen et al.，2016年）。通过引入树数据结构来表示社区，提高了“k-影响社区”模型的时间复杂度.这一贡献提高了社区搜索的运行时间（Li等人， 2017年）。在Chikhaoui et al. （2015），科学论文引用案例研究被用来说明社区之间的影响，每个社区被表示为一个节点，然后构建一个新的网络结构。社区之间的影响力是用每个社区的相互引用数来然后利用Granger模型研究了网络的演化和影响力的动态变化在Lin et al.（2015）和Li et al.（2015）中，为了评估社区对彼此的影响，基于SN中用户之间的交互构建了一个新的网络模型在Lin et al.（2015），SN被转换为二分图，其中每个节点使用影响解耦使用2个节点（输入-输出）表示。然后，使用凝聚聚类算法对二分图进行聚类，使得同一类中的成员在网络中扮演相同的角色。然后，估计每个节点（外节点）对网络的每个簇的影响。CommRank方法旨在通过结合社区之间的内部和外部互动建立一个新的网络模型来估计每个社区的影响力。内部交互表示社区内的个体用户的影响，而外部交互表示SN中社区之间的连接（Li等人，2015年）。基于所进行的调查，观察到大多数社区这些指标并不反映N. 艾曼河Abd Al-Azim等人沙特国王大学学报2234●1/4fg●1/4fg对SN社区的真正贡献。社区之间的互动数量并不能揭示其在SN中传播内容的能力。因此，这些指标可能会误导最终的排名过程。因此，建议的最终排名模型涉及两个主要因素。首先，提出了兴趣组的概念，根据用户的兴趣和交互行为对SN用户进行分解。其次，利用新颖的可达性度量来评估兴趣群体对彼此的影响，以达到最终的排序目标。3. 社交网络动态和兴趣群体排名SN的性质促使其表示为图形模型，其中图节点表示SN用户，边说明节点之间的关系。SN边缘的解释随SN而变化，即Twitter、Facebook等。（2018年）。如图1a所示，节点之间的边表示节点之间的长期关系。这种类型的边是稳定的，不随节点之间的相互作用而变化。因此，它与SN的演化性质不匹配（Tabassum等人，2018年）。另一方面，SN节点之间的交互主要取决于节点因此，对于SN分析的不同目的而言，依赖于长期关系可能非常误导，因为这些关系并不反映SN中节点的真实交互活动。我们认为，应该利用内容传播方向等短期关系，模仿读者的真实兴趣，内容/上下文中的节点3.1. 利益集团识别和排序兴趣组是对传播内容具有相同兴趣的节点的动态集群。这些节点比网络中的其他节点更倾向于相互作用。利益集团成员之间的高度互动有助于节点之间的影响力传播。这意味着所有兴趣组成员都对组内的内容传播做出了贡献。利益集团的形成并不妨碍网络的连通性。这意味着不同的利益集团可以相互作用，导致影响从一个集团传播到另一个集团。因此，有两种类型的互动与任何利益集团。一是利益集团成员在集团内部的互动。第二，网络中不同群体之间的互动。基于所进行的调查，注意到所有现有的作品-除了（Li等人，2015; Belák等人， 2012年）- 注重基于群体成员互动的影响力传播。另一方面，本文强调了利益集团成员的内部活动的影响。利益集团的内部活动体现了其在网络中的中心性程度。此外，这种相互作用说明，利益集团在整个网络内容传播中的贡献。对利益集团内部活动的分析可以揭示利益集团之间的相互影响以及一个利益集团如何影响其他利益集团。此外，利益集团之间的内部活动可以反映出利益集团之间的可达性以及利益集团向SN中其他利益集团传播内容的能力。在我们看来，这种分析使利益集团排名，以下将被称为UltRank。最终排名是一个社区范围排名，其中利益集团作为一个整体排名3.2. 利益集团与终极排序数学模型网络内的内容传播的概念激发了SN作为有向图的表示，其中方向边的长度表示SN节点之间的影响力传播。设G（N，E）是有向图，其中N和E分别表示网络节点和内容传播方向Nn1;n2;n3... ：n l，其中l是网络中的节点数。E1;E2;E3. ：e m，其中m是网络中的边数。作为节点之间的内容传播和节点对传播内容的不同兴趣级别的结果，SN 节点可以被聚类成称为兴趣组IG 的多个不相交的子图（Ayman等人，2020年（如图） 2）的情况。● 子图IGi由一组节点Ni和一组边Ei组成，其中Ni<$ N且Ei<$ E。图二. SN中的利益集团识别Fig. 1.社交网络图形表示。N. 艾曼河Abd Al-Azim等人沙特国王大学学报223502X82●FG00¼f[g0ð 0 0Þ2半]！IG = IG1;IG2;IG3;. ..... ：IG k，其中k是网络中兴趣组的数量。基于图2，在SN聚类之后，一些节点不属于任何识别的兴趣组。这些节点起着重要的作用，它们能够在SN中的不同利益群体这些节点称为网桥节点BN：● BN N● BN <$f BNi jBNiRf Njj j2 kg\入度BNiP1\出度BNiP1g在识别出兴趣组和桥节点后，提出了一种新的概括图SG N;E 可以被构造，其中节点N 是SG中的节点集。NSIGBN .节点N 表示概括的兴趣组SIG或桥节点BN，并且边E直接表示兴趣组之间的内容流，或者通过桥接节点。这种新的结构有利于暴露直接和间接利益集团的影响。任何节点x SIG可以基于其在SG内的内容传播中的贡献来排名。因此，x的秩取决于它在SG中的中心性。独特的是，这项工作中的中心性依赖于节点x到其他SIG节点的可达性。这种新颖的中心性计算方法反映了利益集团在SN中的中心地位，突出了其在SN内容传播中的贡献。相应地，x SIG，影响函数IF可以如下在等式（1）中计算：一曰：如果您是会员，D<$x;y<$;xy2SIG4. 拟议的利益集团最终排名模型为了真正实现最终的排名目标，需要将SN用户聚类为多个兴趣组，然后对这些兴趣组进行排名。UltRank模型旨在根据利益集团在SN中的中心地位对其进行排名。本节介绍了有关拟议模式的详细信息。在下面的小节中，详细介绍了所提出的最终排名（UltRank）模型的阶段和时间复杂度，然后通过案例研究来说明其工作流程。SN中的内容流的性质。这种SN节点有助于SN中不同群组之间的内容传播。因此桥节点不属于任何兴趣组，它们至少有1个入度和1个出度边连接两个不同的组。桥梁节点在内容传播中的作用不可否认。这种联络节点促进了SN中利益群体之间的内容流动过程。此外，这有助于研究利益集团之间的影响力传播。因此，桥节点是分布式系统之间的连接点联合利益集团。在专利申请2中示出的伪代码示出了如何在SN中识别桥节点。4.1.3. 第3阶段社交网络总结该阶段的目标是从SN构建一个新的汇总有向图，其中节点是桥节点或整体兴趣组。此汇总图不仅有助于识别不同兴趣组之间的关系，还有助于说明不同兴趣组之间的内容传播方向。因此，汇总图中的边可以具有三种类型：1. 两个利益集团之间的边缘。2. 利益集团和桥梁节点之间的边缘。3. 两个桥节点之间的边。这种图形概括支持了对利益集团之间直接和间接影响的研究。A lt3中示出的伪代码说明了SN摘要过程。4.1.4. 第4阶段最终排名计算这一阶段的目的是确定网络中每个利益集团的排名。利益集团接触其他群体的能力表明它有潜力将内容传播给网络中的其他群体。这意味着网络中利益群体的中心地位对其在内容传播中的作用有着至关重要的影响。因此，最终排名可以通过测量汇总图中节点之间的距离，然后使用等式来实现。2来计算利益集团g的最终排名：UltRank可达节点数×可达节点组数×14.1. 拟议的最终排名模型独特的UltRank模型主要取决于用户的兴趣。它尺寸规格#用户组如果你是一个ð2Þ允许将SN用户聚类成多个不相交的兴趣组。这种分解允许内容的流动出租书4中所示的伪代码说明了利益集团最终排名是如何发生的。内外利益集团。因此，最终排名可以通过使用兴趣组彼此的可达性来实现。UltRank模型由四个阶段组成：4.1.1. 第1阶段利益集团识别该阶段旨在基于节点之间的内容传播及其交互性来分解SN。因此，具有相同兴趣的节点被分组在一起。兴趣组识别模型（IGI）用于这种SN 分解（Ayman 等人， 2020 年）。IGI 使用著名的强连接组件（SCC）图挖掘方法。SCC采用深度优先搜索算法（Aki，1989）。在A l租m 1中的伪代码示出了如何使用IGI模型从SN捕获兴趣组。4.1.2. 第2阶段桥节点识别该阶段旨在识别SN中的桥接节点这样的节点是算法1.IGI利益集团捕获模型有向输入网络G（N，E）输出Node_ GroupMap、Group_ SizeMap、Node_GroupList（IGL）1：开始2：将SCC应用于G！Node_GroupMap 3：对于每个节点n个graphG4：Group_SizeMap [Node_GroupMap[n]]++ 5：结束6：对于每个组g2组大小映射7：如果组大小映射g> 18：添加gIGL9：如果10：结束11：return Node_GroupMap，Group_SizeMap，IGL12：结束将两个或两个以上的利益集团联系起来，以保证持续的N. 艾曼河Abd Al-Azim等人沙特国王大学学报2236！2！JJJJ2！算法2. 网桥节点识别输入有向网络G（N，E），Node_GroupMap，Group_SizeMap输出桥接节点列表（BNL）1：开始2：对于每个节点n2的图G3：如果GroupSizeMap½NodeGroupMap<$n]]¼1入度[n]P 1出度[n]P 1 4：加上n BNL5：如果6：结束锻造7：返回BNL8：结束13：如果14：结束15：returnUltTable，InfPropTable，InfWMap16：结束4.2. 为例本案例研究演示了应用UltRank模型的四个阶段的过程。考虑图3a中表示的SN，其中节点表示SN用户，并且有向边表示用户与传播内容的交互。UltRank模型的目的是根据用户的兴趣发现用户社区，然后根据这些社区对SN中内容传播的贡献对这些社区进行以下小节说明了UltRank的四个阶段模式来实现这一目标。算法3. SN总结输入有向网络 G （ N ， E ）， Node_GroupMap ，Group_SizeMap，BridgeNodesList（BNL），BNGroupList（IGL）输出汇总有向图SG（2：对于每个边e图G3：GroupID gID 1 = Node_GroupMap[e.source]4：GroupID gID2 = Node_GroupMap[e.destination]5：if gID1！gID26：如果IGL.包含（gID1）IGL.包含（gID2）IGL.包含（gID1）BNL.包含（gID2）BNL.包含（gID1）IGL.包含（gID2）BNL.包含（gID1）BNL.包含（gID2）7：添加gID1、gID2、eSG8：如果结束9：如果10：结束11：返回SG12：结束4.2.1. 利益集团识别实现上述目标的第一步是根据用户对内容的兴趣来发现用户社区。这种兴趣反映为用户之间的交互。相应地，采用IGI模型来识别SN中的兴趣组（如图11所示）。 3 b）。IGI模型保证了同一利益集团成员之间的互惠互动，反过来又制约着同一利益集团内部的共同利益。4.2.2. 桥节点识别实现上述目标的第二步是研究不相交的利益集团之间内容流的连续性。在识别兴趣组之后，一些节点不属于任何识别的组。这些节点是兴趣组之间的桥梁节点的候选者桥梁节点以两种不同的方式连接兴趣组。第一种方式是直接方式，其中桥节点直接从一个利益集团对另一个利益集团另一方面，第二种方法是间接的，其中内容在从一个兴趣组遍历到另一个兴趣组时如图3c所示，SN中的桥节点fB1;B 2;B 3;B 4;B 5;B 6g算法4.兴趣小组最终排名输入有向网络G（N，E），节点组映射，组大小映射，桥接节点列表（BNL），摘要有向图SG（输出UltRankWeightTable（UltTable）、InfluenceWeightTable（InfPropTable）、InfluenceWeightMap（InfWMap）1：开始2：对于每个节点SGnSG3：如果Group_SizeMap[SGn]> 14：计算D [SG n，fN0 -SGng]]！InfPropTable5：sum DInfWMap6：来自SGn的可达兴趣组的总数ReachableGroupsCountMap7：来自SGn的可达组大小图8：UltRankWeight =1[InfWMap½SGn]9：UltRankWeigh t*=ReachableGroupsCountMap½SGn]IGLj10：UltRankWeigh t*=ReachableGroupsSizeMap 1/2SGn]jN j12：添加SGn，UltRankWeight！UltTable以保证内容在兴趣之间的流动使用内部活动的团体。4.2.3. SN汇总实现上述目标的第三步是使用兴趣组、桥节点和内部活动构建一个新的汇总图。这种新的结构简化了SN的表示，便于分析SN中利益集团对传播内容的贡献。如图3d所示，每个兴趣组被映射到汇总图中的单个节点，并且桥节点充当这些节点之间的连接器以确保内容流的连续性4.2.4. 最终等级计算实现上述目标的第四步是在新的汇总图中对每个汇总兴趣组进行排名。每个汇总的利益集团的最终排名基于其在SN中的影响力这种影响体现为三个主要因素：从兴趣组到其他组的距离利益集团的规模与所有可触及利益集团的规模相比JJ！！●●N. 艾曼河Abd Al-Azim等人沙特国王大学学报2237ðþÞð Þð × Þð Þð 0þ0 ð 0ÞÞ 00图三. UltRank模型的四个阶段的应用。相对于SN中所有兴趣组数量的可达兴趣组数量。基于这些因素，新的可达性度量被用来衡量在SN中的兴趣组UltRank权重。如表1所示，计算每个兴趣组的UltRank权重，并对这些组进行降序排序。可以看出，利益集团G3具有最高的最终排名，因为它可以达到多达4个利益集团。这意味着G3在网络中拥有最中心的地位。因此，兴趣组G3具有最高的内容传播能力.4.3. 计算复杂度基于A ltint m 1，在深度优先搜索算法计算复杂度的基础上，兴趣组识别阶段的计算复杂度为O N E。其中N是SN中的节点数，E是边数此外，在A lm2的基础上，当N为SN中节点数时，桥节点识别阶段的计算复杂度为O N由Alxim 3可知，图求和阶段的计算复杂度为OEg，其中E和g是SN中的边数和兴趣群数.最后基于A ltam4，将最终秩计算阶段的计算复杂度第一，遍历每一对概括的利益集团的复杂性在总结图中是O g2，其中g是SN中的兴趣组的数量。第二，计算汇总图中每对汇总兴趣组之间的最短路径的复杂度为OENLogN），其中N和E分别为汇总图中的节点数和边数。为了保证可扩展性，采用了并行实现5. 结果、评价和讨论为了评估所提出的UltRank模型，进行了验证性实验。存在各种最先进的方法，其目标是在SN中进行社区检测和排名。然而，建议的排名模型作为一个整体，不能com-concerned到他们中的任何一个，由于其在接近其目标的独特性进行了大量的实验，以评估所提出的模型阶段从许多角度对不同的国家的最先进的方法。为了评估所提出的模型，进行了两组实验，从不同的角度来评估其性能第一组实验Exp（I）的目的是找到与Li等人的著名CommRank模型、PageRank和度相比，所提出的模型的排名准确性。（ 2015年）。第二组实验Exp（II）旨在从两个角度评估IGI模型，第一个角度Exp（II）1使用三个实验评估聚类质量。第一个实验Exp（II）1.a说明了表1汇总图中每个兴趣组的UltRank权重朝向向内G1G2G3G4G5总和UltRankG102––460.183G2–0––220.083G322024100.4G4–––0220.1G5–––––––●N. 艾曼河Abd Al-Azim等人沙特国王大学学报2238-PP表2Exp（I）数据集拓扑特征。表3Exp（II）数据集的拓扑特征。数据集节点数边数网络密度Twitter列出网络23，370 33，1010.6061E- 05Linux网络30,837 213,954 0.00022500Kendall TauExp（II）分为两个视角，第一视角Exp（II）1使用以下评价指标来评价所识别的利益群体的质量和同质性：采用聚类质量度量中的轮廓系数来评价所形成的兴趣群体的质量。它将同一簇中的节点之间的距离与其他簇中的节点之间的距离进行比较，从而指示聚类质量。轮廓系数范围在1和1之间，具有正趋势。03 The Dog（1987）● 用Jaccard系数评价地层Linux内核邮件列表回复网络六十三万九百九十九一千零九万六千四百四十3.12E-04利益集团。它比较了不同兴趣组中节点之间的相似性。它定义了相似性，Epperly Trust Network 131，828841，372 4.84E- 05Wikipedia talk，荷兰网络225，7491554699人1.11E- 05网络规模和利益集团的数量第二个实验Exp（II）1.b，考察了利益集团的同质性然后使用第三个实验Exp（II）1.c来评估兴趣组分离的质量实验Exp（II）2的第二个视角旨在从排名质量的角度评估所提出的UltRank模型。因此，进行了两个实验来评估排名的能力在第一个实验Exp（II）2.a中，邻居的数量。Jaccard系数的范围在0和1之间（Ahajjam等人，2018年）。第二个视角Exp（II）2旨在根据以下评价指标评估排名能力和有效性：最终排名能力（URC）度量用于评估兴趣群体的排名能力。它比较排名的兴趣组的大小相对于在特定修剪因子K下的整个网络的大小，使用等式：3 .第三章。使用新的评估度量终极排名能力（URC）来评估兴趣组排名。在第二个实验Exp（II）2.URC中国大小排序的兴趣组大小排序的兴趣组相对于K的大小b、最终排名对内容传播的影响是使用独立级联（IC）模型（Goldenberg例如， 2001年）。×100ð3Þ5.1. 数据集在两组实验中使用真实数据集。对于第一组Exp（II），使用三个数据集：橄榄球，足球和奥运会网络。这些网络已经基于地面实况进行了聚类。(As如表2所示）（Greene和Cunningham，2013年）。关于第二组实验Exp（II），使用五个不同的数据集（表3展示了关于数据集的拓扑特征的更多细节）：Twitter列表网络的节点代表Twitter用户，有向边对应于用户之间的关注关系。Linux网络，节点表示Linux源文件，有向边表示Linux文件之间的包含关系。Linux内核邮件列表回复网络，其中节点代表人员，每个有向边代表用户对另一个用户的回复。Epperly信任网络，其中节点代表用户，每个有向边对应于两个用户之间的信任关系。Wikipedia talk，荷兰语网络，其中节点表示荷兰语维基百科用户，有向边表示用户之间的消息。5.2. 评估指标为了评估所提出的模型，使用了五个评估指标。对于Exp（II），使用以下评估度量：独立级联（IC）模型用于评估利益集团排名对信息扩散的影响IC示出了网络覆盖的概念，其根据由称为种子节点的特定节点开始的信息传播（Goldenberg等人， 2001年）。5.3. 基准方法为了评估所提出的模型，不同的基准方法用于每组实验。对于第一组实验 Exp （ II ），使用三种基准方法：首先，CommRank考虑社区之间的相互作用和内部活动（Li等人，2015年）。第二，两种不同的中心性度量，只考虑社区内部活动，如PageRank（Page et al.， 1999年）和度。对于第二组实验Exp（II），使用两种基准方法：第一，影响焦点（IF）策略，其取决于社区成员的外部特征（Belák等人，2012年）。第二，只考虑内部特征（如社区规模）的中心性度量。5.4. 实验结果实验是在一台配置Intel Core i5处理器和6 GB RAM的PC机上进行的。关于所提出的模型实现，使用Microsoft Visual Studio 2017IDE，使用C#编程语言版本7，并使用Quickgraph库版本4进行图形相关操作。此外，关于存储，SQL Server Management Studio 2012用于数据集存储，操作和结果存储。最后，并行执行●●●●●●●●●●●数据集节点数边缘数量网络密度橄榄球网络85425010.003433足球网24817240.028438奥林匹克网络46442070.019582N. 艾曼河Abd Al-Azim等人沙特国王大学学报2239¼¼利用任务并行库（TPL）保证了模型的可扩展性。首先，采用Exp（I）来验证由UltRank模型获得的排名列表与CommRank、PageRank和度的准确性（如表4所示）。在表4中，KendallTau在Rugby网络、Football网络和Olympics网络中，UltRank的KendallTau系数分别达到0.92、0.74和0.75。这意味着UltRank 模型的平均排序准确率为 80.33% ，而 Comm-Rank 、PageRank和度模型的平均排序准确率分别高达85%、70%和65%。从表4中可以看出，所提出的模型实现了与Li等人（2015）相当的结果。与此不同的是，所提出的模型聚类的节点，这意味着它是通用的，它不需要集群被标记在前面。这一显著特征与SN的动态特性相适应在对所提出的模型的排序准确性进行评估之后，进行第二组实验Exp（II）以进行进一步的评估。第一个实验（II）1.a，评估IGI模型，以评估网络规模和识别的利益集团的数量之间的关系。进行修剪过程，其中消除大小小于修剪因子K的兴趣组。在表5中，感兴趣的数量有

下载后可阅读完整内容，剩余1页未读，立即下载