没有合适的资源?快使用搜索试试~ 我知道了~
Instagram上基于参与度和活跃度的影响力最大化扩散模型——沙特国王大学学报
沙特国王大学学报Instagram上基于参与度和活跃度的影响力最大化扩散模型Kristo Radion Purba,David Asirvatham,Raja Kumar Murugesan马来西亚泰勒大学计算机与信息技术学院阿提奇莱因福奥文章历史记录:收到2020年2020年9月17日修订2020年9月19日接受2020年9月24日网上发售保留字:影响力最大化扩散模型A B S T R A C T影响者是社交媒体上有影响力的内容创建者。影响者的出现导致了影响者营销的增加。通过影响力最大化(IM),人们广泛研究了挑选正确影响者的任务。现有的IM研究在理论性能方面已经成熟,但在现实世界中不是很现实。首先,现有的IM扩散模型其次,没有研究将Instagram上的激活用户与实际受影响用户进行针对这两个问题,在独立级联模型和线性阈值模型的基础上,提出了三种新的实际扩散模型,即IC-u、LT-u和UAD模型。这项研究使用Instagram数据进行。同时,UAD模型使用了两个阈值,即用户意识和用户倾向。这些模型结合了用户的活跃度和参与度因素,分别代表影响的敏感性和影响的程度。所提出的模型被证明是高达2.72倍更真实,并产生更多的参与和更活跃的用户。种子集(影响者)所确定的IM算法下提出的模型,预计有更多的实际品牌营销活动的影响,如果与现有的模型。©2020作者由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 背景社交媒体已成为数字营销和影响者的温床(Constantinides,2014)。Instagram是参与度最高的平台(Feehan,2019),非常适合品牌营销。影响者是对政治有影响力的名人或普通用户(Weeks等人,2017年),采购决策(Ogunyombo等人,2017),和意见(Moussaïd等人,2013年)。数字营销具有许多优势,例如更实惠,有效和真实(Roelens等人,2016年,与传统相比。然而,企业用户在为品牌营销挑选影响者时存在各种限制,特别是参与率(Gupta和Mahajan,2019)。追随者的增长,达到,印象(拉博,电子邮件地址:kristoradionpurba@sd.taylors.edu.my(K.R.Purba),David.asirvatham@taylors.edu.my(D.Asirvatham),rajakumar.murugesan@taylors.edu. 我的(R.K. Murugesan)。沙特国王大学负责同行审查2018),假用户,成本与追随者比率(Activate,2016)是影响者考虑的其他一些有用的指标。影响最大化(Influence Maximization,IM)是一个被广泛研究的问题,其目的是识别具有最大影响传播的影响者(种子集)的集合(Kempe等人, 2003年)。扩散模型是IM的重要组成部分,用于模拟选择一组用户时的影响力传播 线性阈值(LT)和独立级联(IC)是最早和研究最多的扩散模型(Kempe等人,2003),其中博弈论模型是最新的模型之一(Li et al., 2017年)。在理论性能方面,IM算法的影响力和运行时间继续增长。 关于IM的最早的工作(Kempe等人,2003)提出了第一个贪婪启发式IM算法。它后来被CELF++(成本有效的惰性转发)算法改进(Goyal等人,2011年)通过消除增益重新计算。ASIM算法(Galhotra等人,2015)进一步改进了CELF++,速度提高了6-8倍。TIM(两阶段IM)算法(Tang等人,2014)通过使用RR集提高了准确性。IMM(经由鞅的IM)算法(Tang等人,2015)通过增加鞅估计改进了TIM。最近的一项研究结合了机器学习(Li et al.,2019a,b)用于信息扩散训练以提高运行时间。到目前为止,IMM和SSA产生了最好的影响传播。https://doi.org/10.1016/j.jksuci.2020.09.0121319-1578/©2020作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。制作和主办:Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.comK.R. Purba等人沙特国王大学学报2832最近的研究更侧重于使IM更逼真。研究了各种因素,例如多个社交网络上的IM(Kuhnle等人,2018年; Li等人,2019ab),间接影响(Wang和Street,2018),竞选反馈(Lagrée等人,2017),情感(Jendoubi和Martin,2019),主题相似性(Hamzehei等人,然而,社交网络的其他方面仍然被忽视,特别是基于地面实况数据的激活用户分析。此外,Instagram上没有IM研究,这与Twitter不同。受欢迎程度指标是Instagram研究的一个重要组成部分,最具吸引力的平台。为了加强用户之间的关系,最近的一项IM研究采用了发送者基于这一思想,我们将用户的活跃度和参与度纳入我们提出的模型。活跃度表示用户查看Instagram的频率。从某种意义上说,主动用户会比被动或机器人用户看到更多的帖子,因此更容易受到影响。与此同时,参与度代表了用户有多喜欢.拥有强大粉丝基础的影响者将比拥有许多虚假粉丝的影响者具有更大的影响力,这可以使用参与值(每个粉丝的喜欢)轻松验证(Captiv8,2018)。本文介绍了三种实用的扩散模型,即独立级联-用户感知模型(IC-u)、线性阈值-用户感知模型(LT-u)和用户感知模型(UAD)。此外,我们还介绍了使用地面实况数据计算的指标的真实世界基准,即喜欢者重叠(LO),品牌影响力(BI)和平均用户受欢迎度指标。流行度度量是参与度等级(EG)、参与率(ER)、追随者增长(FG)和局外人百分比(OP)(Purba等人,2020年a、b)。我们使用了一个Instagram数据集,该数据集是通过各种来源的抓取技术收集的。模型和真实世界的基准指标,以及Instagram上最早的IM实现,突出了这项研究的贡献。增加活跃度和参与度因素,以及真实世界的基准指标,旨在适应真实社交网络的动态。与最近的类似研究相比,我们试图采用一种更直接和现实的方法。(Aral和Dhillon,2018)的研究使用预测(而不是实际值)来生成参与值,(Panagopoulos等人,2018年)使用了长达11个月的真实数据进行训练。此外,由(Panagopoulos等人,2018年)是基于转发数据,这并不直接衡量激活用户的任何受欢迎程度指标。在这项研究中解决了以下问题,即。(Q1)在所提出的扩散模型下,每种最先进的IM算法的理论性能如何?(Q2)现有的IM扩散模型(IC和LT)以及提出的扩散模型(即IC-u、LT-u和UAD模型)的真实性如何?实际上,建立现实的扩散模型的目标是基于两个问题,即, 如果激活的用户在现实生活中不受影响呢?“.本文的其余部分组织如下,即,相关著作、研究方法、实验结果、讨论、结论及未来工作。2. 相关作品理论表现,或预期的影响力传播,已被广泛研究的任何IM研究。随着时间的推移进行了各种改进,例如IMM(Tang等人,2015)、SSA(Nguyen等人,2016),以及最近的DISCO(Li等人,2019年a,b)。然而,在(Li等人,2019a,b)表明,最近的IM算法在任何数据集中具有几乎相同的性能。尽管是一个长期研究的问题,IM的理论性能和现实世界的性能之间的相关性是值得怀疑的。最近的研究在种子集计算中纳入了用户因素,如影响程度和易感性(Aral和Dhillon,2018),参与度(Jendoubi和Martin,2019),对第二社区的影响(Karampourniotis等人,2019年)。尽管这些研究引入了几个新的基准指标,但这些指标仍然是理论性的。另一个与用户相关的因素是多媒体的内在特性(Amato等,2017年);然而,提出的工作是一个初步的数据模型,没有进一步基准。在(Karampourniotis等人,2019)被用来寻找LT和IC扩散模型下的超级传播者,没有基于实际数据的进一步分析。(Aral和Dhillon,2018)使用的敏感性因子是通过涉及合成数据生成的,并使用影响扩散和种子重叠进行基准测试,这仍然是理论上的。基于意见的IM(Jendoubi和Martin,2019)使用真实的正面和负面意见数据进行基准测试,这是病毒式营销的关键因素。最近的一项研究(Panagopoulos等人,2018年)使用转推数据进行真实世界的基准测试;然而,它需要11个月的训练数据,并且转推功能在其他社交网络上不可用。总的来说,本研究采用了一种不同的方法来衡量IM的真实表现,如果与以前的研究一致,这更实用。这些指标旨在比较扩散模型下的激活用户与实际受影响用户之间的重叠。在社交媒体营销中,有几种方法可以检查受影响的用户,例如点赞者和评论者(Winter等人,2015),提及和转发(Cha等人,2010年),这是直接观察到的社会网络。本研究使用类似者和提及数据作为性能测量的基础事实。目前我们废弃评论者数据。3. 研究方法本研究分为三个阶段,即:数据收集、模型实施和评估。该研究的数据集来自Instagram,其中包括70,409个节点(用户)和1,007,107条边(追随者和被追随者关系)。它是从马来西亚24所私立大学的Instagram账户的追随者中收集的。收集的数据发布在公共存储库1中。还有其他支持性数据,即,点赞者(47,429,671个条目)、帖子(1,007,107个条目)和提及(504,533个条目)。在图形创建期间,仅保留70k用户之间的连接以维护封闭的图形。出于即时通讯的目的,根据粉丝数量、参与度和粉丝增长构建了两个Instagram图表这两个图表如下:IC和LT模型的图形,其中边权重设置为追随者的追随者数量的反比IC-u、LT-u和UAD模型的图表,其中边权重基于追随者数量、参与度和追随者增长。本节将讨论基线算法、扩散模型和基准方法。1本研究中使用的数据集可在https://www.kaggle.com/krpurba/im-instagram-70 k中获得●●K.R. Purba等人沙特国王大学学报2833(c) 关于我们ðÞð Þ ð Þ(c)Þ¼(c)中文(简体 )3.1. 扩散模型扩散模型是一种模拟网络影响的方法。本研究使用了两种基本的扩散模型,即线性阈值(LT)和独立级联(IC),并增加了新的扩散模型。虽然IC和LT在理论上是优雅的,但它们并不衡量活跃用户的参与度和活跃度。从某种意义上说,这些模型可以激活被动用户,这些用户在现实世界的社交网络中不太可能受到影响。本研究提出了三种新的扩散模型,即IC-u,LT-u和UAD,旨在激活尽可能多的参与和活跃的用户。这些模型维持了使用定义为Wen(weight:engage)的边权重,其公式如下:W n flr EG n1 3关注我们与LT模型类似,对节点的传入影响(W_en)将增加用户的感知水平,并且如果其超过感知阈值,则节点将被标记为感知。该阈值是节点FG的加性逆,这意味着具有较高FG(较高活跃度)的节点更容易被感知。意识阈值被定义为Taw,其公式如下:在LT和IC模型中使用,表示1陶春亭1-FG节点4节点节点人接受影响力。所提出的模型使用用户的参与度和活跃度来确定的影响力和敏感性的程度,分别。一项研究表明,用户的参与度与消费者的购买意愿相关66%(Rahman等人,2017年),这表明参与度(喜欢和评论)较高的用户在社会上的影响力更大。虽然用户的活跃度不能直接从API获得,但关注者的增长与活跃度高度相关(Bellavista等人,2019年)。在一个极端的例子中,使用自动机器人控制的用户可以在短短四个月内获得+367,83%的关注者增长。现有的和拟议的扩散模型如下所述。A. 现有模型:独立级联(IC)和线性阈值(LT)在IC模型中,在每个时间步长t,每个活动节点将被给予机会来激活其每个跟随者flr,概率为P n;flr,其中n是源节点,flr是目标节点(跟随者)。如果某个节点在此时间步中保持不活动状态,则在以后的时间步中将无法进一步激活该节点在LT扩散模型中,如果跟随者flr的传入边缘的权重的和超过其阈值Tflr,则跟随者flr该阈值被设置为跨所有节点的统一随机数。节点n的边概率/权重是跟随者的跟随者数量的反比¼2ωð如果节点已经知道(趋势或影响),则即将到来的影响将尝试使用权重W tend来激活影响的第二阶段,即趋势,该权重Wtend与原始LT的权重相同如果一个节点的趋势水平超过趋势阈值Ttend,则该节点将被标记为具有趋势,这与原始LT模型相同然而,这里Ttend被设置为0-0.5之间的均匀随机数,总的来说,在UAD模型中,用户必须意识到并且具有被激活的倾向。请注意,阈值中使用的一半因子是由于UAD的UAD模型旨在放大用户的EG因素和追随者的FG因素,同时保持接收影响的趋势的随机阈值UAD中节点激活的条件为如下所示:● 如果(累计Wen)>=Taw THENaware = trueIF感知 = true AND(累计W tend)>= T tend然后tend= true● 如果aware= true ANDtend = true则激活3.2. 基线算法现有的算法预计将与所提出的模型,因为模型只修改的边缘权重的网络,P nflr1关注我们B. IC -用户感知(IC-u)和LT -用户感知(LT-u)ð1Þ工作以下IM算法用于找到所提出的模型的种子集,即:IMM(通过鞅的影响最大化)(Tang等人,2015年),这是一个国家的最先进的算法方面所产生的影响力蔓延。在IC-u和LT-u中,边概率/权重是节点的EG、跟随者的跟随者的数量(跟随)的反比和跟随者的归一化FG(范围为0.0-1.0)的乘积IC-u和LT-u的边权重公式如下:(注意,常数1.5可以设置为任意值,以产生合理的影响范围)SSA(Stop-and-Stare Algorithm)(Nguyen等人,2016年)。这种算法有一个显着更快的运行时间(高达1200倍)比大多数IM算法。贪婪算法(Kempe等人,2003年)。该算法将初始化一个最佳影响者,每次添加一个最佳影响者,直到达到种子集的最大数量。在每一次迭代中,所有用户都将被模拟,这将导致巨大P n flr1 5EG n1关注我们ωFGðflrÞ ð2Þ运行时。3.3. 理论和实际性能基准C. 用户感知扩散(UAD)UAD模型采用两个阶段的影响,即用户虽然IC-u和LT-u模型与现有算法配合良好,但UAD可能有所不同。然而,进一步的实验表明,UAD模型的性能影响传播和运行时间(Kempe等人,2003年)被用作理论基准。影响扩散是来自N次重新模拟的激活用户的平均数量。IC、LT、IC-u和LT-u模型使用公共源代码2以e = 0.1进行模拟,而UAD模型被模拟了10,000次,这也由(Tang et al.,2015年)。此外,现实世界的基准是在激活用户方面,两个. 在UAD中,影响的第一阶段是激活意识2https://github.com/hungnt55/Stop-and-Stare●●●●K.R. Purba等人沙特国王大学学报2834联系我们ð Þ ¼×提出了一个新的度量标准,即喜欢者重叠(LO)、品牌影响力(BI)和流行度度量,如下所述。真实世界的基准度量是基于每个用户的喜欢者、关注者和提及以及受欢迎程度度量来计算的。A. Likers重叠百分比(LO)当在选定的扩散模型下模拟种子集(影响者集)时,它会产生激活的用户。LO值比较理论上激活的用户与实际激活的用户(后喜欢)。由于每次模拟通常会产生不同的结果,因此LO和其他后续度量被模拟1000次以获得平均值。LO值假设受影响的用户是喜欢者。较高的LO值意味着更接近真实。LO值是“激活用户中喜欢的用户比例”,如图所示。 1,并制定如下:Fig. 1. 喜欢者重叠百分比(LO)。LOinfluencer100赞活跃用户影响者活跃用户、影响者、B. 品牌影响力(BI)ð5Þ4. 实验结果在本节中,理论基准和现实世界品牌影响力(BI)被定义为用于计算BI和LO的关注者数据是原始数据,其包括图外的所有关注用户。BI指标假设提到的用户总是品牌。无论品牌或非品牌,如果激活的用户跟随提及的用户,它仍然可以被认为是一种影响力。 BI配制如下:提出了每个IM算法和扩散模型的基准。此外,我们还比较了不同的扩散模型之间产生的种子集。4.1. 理论基准IC和LT模型下的算法之间的影响扩散基本相似,如图所示。 2和图3.第三章。这benchmark只是用来演示每个BI影响者100Most 提到的品牌影响者活跃用户、影响者、C. 已激活用户ð6Þ算法在新获取的数据集中,以供参考。在IC模型下的总运行时间如下:Greedy 351335.4 s,SSA 16.8 s,IMM 55274.4 s,而对于LT模型如下:Greedy 348183.2 s,SSA 15.3 s,IMM 55976.3 s。贪婪被排除在运行时图表中,因为它比其他算法更重要。为了衡量用户的影响力,本研究使用了四个流行度指标,即:参与率(ER %):喜欢和评论的数量除以关注者(Vorhaus,2018)。参与等级(EG)(Purba等人,2020a,b):参与率和追随者数量之间的公平比较。从本质上讲,这是因为关注者较少的用户通常具有较高的ER,反之亦然(Vorhaus,2018)。EG是0.0和1.0之间的数字,其被公式化为:IC-u和LT-u模型下的结果与IC和LT模型下的结果有很大不同,如图所示。 4和图 五、IMM算法尽管SSA在IC-u模型中可以赶上Greedy,但它在LT-u模型中的表现略逊于Greedy。 IC-u模型下的总运行时间如下:Greedy 367118.1 s,SSA 8.4 s,IMM 78334.3 s,LT-u模型为如下:贪婪372213.4 s,SSA 12.0 s,IMM 77713.7 s。RR集,这是IMM和SSA算法的骨干,可能不会产生一个最佳的结果,所提出的模型。UAD模型需要两种类型的边权重,即Wen(基于EG用户最小ER用户数1 0参与度和追随者增长)和W趋势(趋势,类似7ð Þ ¼103×ER基线值,使用者100;:原始的LT模型)。由于IMM和SSA算法没有明确地针对两个阈值进行设计,其中:ER基线=根据(Vorhaus,2018)提供的图表,基于用户关注者数量的平均ER局外人百分比(OP %)(Purba等人,2020a,b):非关注者的帖子点赞者数量除以帖子的总点赞者。Followers growth(FG %):一个月内粉丝数量的增长。在扩散模拟中,期望激活的用户具有高FG、EG、ER、OP值,以确保激活的节点是活跃/参与用户。IC和LT扩散模型忽略了这些指标,应该具有较差的性能。这些算法都是从LT-u模型中提取的,与UAD模型最接近。在UAD模型下,SSA已经证明了其优于IMM,而仅略落后于Greedy。SSA算法在所有提出的模型下都表现得很好,即使它不是为它们设计的而IMM仅适用于IC-u模型。与LT-u和UAD模型相比,IC-u模型是最简单的,它只涉及一个单一的变量来计算影响概率。相比之下,LT-u涉及两个变量(权重和阈值),UAD涉及四个变量(两个权重和两个阈值)。UAD模型的影响传播和运行时间如图所示。 六、UAD模型下的总运行时间如下:Greedy 443093.6 s,SSA 12.0 s,IMM 77713.7s●●●●K.R. Purba等人沙特国王大学学报2835图二. IC模型下的基准。图三. LT模型下的基准。见图4。 IC-u模型下的基准。K.R. Purba等人沙特国王大学学报2836图五. LT-u模型下的基准。见图6。 UAD模型下的基准。4.2. 真实世界基准-程序本节通过模拟单个用户和一组用户作为种子集来展示真实世界基准测试的结果。该测试不依赖于算法,因为候选者是在扩散模型下模拟的。由于如果选择为单个种子,则并非所有用户都表现良好,因此必须将这些用户与其他用户组合。程序真实世界基准的设置如下:Likers数据基于每个用户的最新12个帖子。使用我们的抓取方法可以收集的帖子数量通常是每个用户12-18个最新帖子。 任何帖子少于12个的用户都被排除在外,每个用户只包括12个最新帖子用户数据按关注者数量降序排序没有点赞者数据的用户被排除在外(2841名用户);这是由于抓取过程中的意外错误。创建候选影响者(种子集)的各种组,如下所示:o 追随者数量(在图中,不是实际数量)> 50的用户被选为单个种子(1789个候选人)。如果作为单个种子激活,则具有50个关注者的用户产生平均1.68的非常低的影响力传播(低于50个关注者)。UAD模型)。同时,更多的追随者永远不会产生小于2的影响力传播,例如50-99的追随者为2.36。o 关注者在25到50人之间的用户被分成五组,并被选为候选人(652名候选人)。与前面的分析类似,将关注者在0到25之间的用户组合成一个五人组,产生了1.86(UAD)的低平均影响力传播o 为了产生更大的影响力传播,所有具有追随者的节点>= 25个再次组合成10个组(505个候选人)、20个组(252个候选人)和30个组(168个候选人)然后,在每个扩散模型下模拟每个候选种子。总共有3366名候选人。最终的度量值是来自1000个扩散模拟的平均值。所有产生影响力传播小于1.0的候选人都被排除在外,以防止有偏见的结果。具体到BI值,BI仅从单个候选项(1789个候选项)计算,因为获得最多提及的品牌仅适用于单个用户。结果见表1。请注意,所提出的模型并没有针对OP进行优化,其中不包括OP。●●●●●●K.R. Purba等人沙特国王大学学报2837表1真实世界基准(程序)结果。扩散模型LOBIFGEG儿OPIC6.505.571.164.4012.0447.04Lt6.455.581.164.4112.0646.98IC-u11.277.532.264.9913.7442.52LT-u11.047.322.275.0313.8642.46UAD17.7313.843.835.4015.2146.12见图7。 各种意识/倾向比率的影响。计算。此外,OP不是参与度和活跃度的直接衡量标准,这使得OP在这个基准中的用处不大。IC-u和LT-u模型在除OP外的所有指标上都优于IC和LT模型。IC-u和LT-u产生的激活用户分别有11.27%和11.04%的点赞者重叠(LO),这意味着这些激活用户的比例是影响者帖子的实际点赞者它们还分别产生了7.53%和7.32%的品牌影响力(BI),这意味着这些激活用户的比例遵循影响者提到的品牌在LO和BI值上的优越性证明了IC-u和LT-u比IC和LT更符合实际此外,IC-u和LT-u还产生了激活用户的更高的FG、EG和ER,这意味着激活用户更有吸引力(基于EG和ER值)和更活跃(基于FG值)。一个更真实的扩散模型将最终帮助IM算法产生更好的种子集。例如,在SSA和IMM中,RR集是通过对图进行采样来获得的。使用的边权重在所提出的模型中(基于参与度和活跃度),将改变有影响力的用户在采样图中的排名。UAD模型在所有指标中产生了最好的结果,甚至优于IC-u和LT-u。这可以通过UAD中使用的“半意识”和“半趋势”阈值来解释为了测试不同的意识和倾向值的效果,进行了额外的实验来测试平衡实验基于由Greedy产生的种子集,其中种子数量= 30。在该测试中,选择LO作为主要比较器,因为与其他指标相比,LO是更直接的影响测量 如可见于图 7、50/50的比例(50%的人知道-度和50%倾向)产生最佳LO值10.1%。另一方面,0/100比率是原始LT模型,其产生低得多的5.8%的LO。意识值的增加,即使低至10%也有助于增加LO,这证明了意识和倾向因素都存在于社交网络中4.3. 真实世界基准-随机随机测试是通过随机选择一组影响者进行的,每组30名用户。与程序检验(第4.2)相比,该随机化检验旨在进一步证明扩散模型在各种随机条件下的有效性该随机试验的设置如下:实验进行了10,000次。每次,随机选择30个用户作为种子集(影响者),并使用扩散模型进行模拟(1000次)以获得Metrics值。以下部分中显示的结果基于所有实验的平均值,这些实验由随机的、唯一的一组影响因素组成。每个实验使用在所有扩散模型中设置的相似种子。BI指标不适用于此测试,因为它只能为单个用户计算。结果见表2。其结果与程序试验一致除了OP指标之外,IC-u和LT-u模型在所有指标上都优于IC和LT模型,而UAD模型优于所有模型。4.4. 重叠种子集由于边权值的不同,IM算法在传统模型(IC,LT)和本文提出的模型下产生的种子集也不同。由于所提出的模型更真实(基于真实世界的基准),因此在所提出的模型下产生的种子集也将更真实。现实的种子集将有一个更好的结果在一个实际的营销活动。图8和图9示出了来自UAD模型(作为最真实的模型)的种子集和来自UAD模型(作为最真实的模型)的种子集之间的重叠。其他模特。注意,由于LT-u和UAD模型使用相同的种子集,因此LT-u被排除在图之外SSA算法的平均重叠率分别为:IC算法47.8%, LT算法40.51%,IC-u算法 69.19%IC和LT模型与LT-u/UAD模型的种子集相似度较低的表2真实世界基准(随机)结果。扩散模型LOBIFGEG儿OPIC7.74–1.294.7613.0747.36Lt7.63–1.294.7813.1147.34IC-u12.41–2.796.3317.7646.27LT-u11.68–2.806.4118.0346.45UAD22.90–3.296.5318.6047.13●●●K.R. Purba等人沙特国王大学学报2838图8.第八条。种子与UAD/LT-u模型的重叠(SSA算法)。见图9。种子与UAD/LT-u模型的重叠(IMM算法)。另一方面,IMM算法的重叠显示出IC-u模型的低数值。这是由于IMM在所提出的模型下具有比SSA差的性能,如图4和图5所示,这意味着IMM在这些模型下不能正确工作。因此,我们保留SSA结果作为本节的结论。5. 讨论本研究提出了三个扩散模型,比广泛研究的独立级联和线性阈值模 型 更 IC-u ( Independent Cascade-User Aware ) 和 LT-u(Linear Threshold-User Aware)修改了原始模型的边权重,该边权重基于影响力发送者的参与度(EG)和追随者的追随者增长(FG)。EG衡量的是用户在社会中的受欢迎程度,而FG衡量的是用户的活跃度UAD(user aware diffusion)模型具有两个节点激活阶段,即基于EG和FG的感知和使用均匀随机数作为阈值的趋势,就像LT一样。传统的影响传播和运行时间基准测试是从理论上衡量算法性能的方法。为了提供更真实的结果,提出了额外的基准指标,即喜欢者重叠(LO),品牌影响力(BI)和平均用户喜欢者重叠(LO)测量喜欢者的激活用户的比例。相比之下,品牌影响力(BI)衡量的是关注影响者提及最多的品牌的激活用户的比例。IC-u、LT-u和UAD模型在LO、BI和流行度指标方面始终产生更好的性能,这意味着所提出的模型更真实。基于手术真实世界基准,LO值分别为6.50%、6.45% (IC 和LT)、11.27%、11.04%、17.73%(IC-u、LT-u和UAD)。通过比较现有模型和所提出的模型的最高LO值,所提出的模型比现有模型真实度高2.72倍同样,在BI方面,所提出的模型比实际模型高出2.48倍(UAD与LT模型)。6. 结论和今后的工作通过一种称为影响力最大化(IM)的技术,人们广泛研究了如何识别传播信息的最佳影响者。尽管Instagram是最好的营销平台,但本研究中没有对Instagram进行IM研究IM的主要基准方法是影响传播和运行时间。然而,这些数字近年来没有改善。2015年和2016年研究中的IMM和SSA算法仍然是表现最好的,这表明IM研究在理论性能方面已经成熟最近的IM研究更侧重于使IM更真实,如添加用户因素、多重影响、多时期、多社交网络等。现有的算法被证明是相当正确的工作在所提出的扩散模型的理论基准方面,即使贪婪算法有一个稍微好一点的影响传播,如果在LT-U和UAD模型下的SSA相比而在IC-u模型下,IMM和SSA与Greedy的作用类似,这是由于IC-u模型的简单性。所提出的模型已被证明可以产生更有吸引力和更活跃的用户,并且比IC和LT模型更逼真2.72倍。总体而言,本研究填补了理论基准和IM在现实世界中的实施之间的差距。实际上,由算法和模型选择的影响者预计在实际营销活动中具有更大的影响力。在未来的工作中,我们期待着设计一个算法-Rithm专门针对所提出的模型进行了调整。虽然贪婪算法工作,但在实际情况下运行时间是无法忍受的,而SSA通常可以产生1 s以下的种子集,具有几乎相似的影响范围。就点赞者重叠值而言,尽管所提出的模型更真实,但如果能够获得更多的数据,如评论,产品购买者和评分者,则可能会提高高达17.73%的结果值。竞争利益一个也没有。引用2016年启动我们问,他们回答:微影响者如何真正想与品牌合作,s.l.:启动。Amato,F.,莫斯卡托,五,Picariello,A.,Sperli,G.,2017.多媒体社交网络中的扩散算法:一个初步模型。s.l.,2017年 IEEE/ACM社交网络分析与挖掘进展国际会议。Aral,S.,Dhillon,P.S.,2018.经验影响模型下的社会影响最大化。Nat.行为举止。2,375-382.贝拉维斯塔山口,福斯基尼湖,Ghiselli,N.,2019.社交媒体增长策略分析:Instagram用 例 。 s.l. , IEEE 第 24 届 通 信 链 路 和 网 络 计 算 机 辅 助 建 模 和 设 计 国 际 研 讨 会(CAMAD)。Captiv8,2018. #nofilter:如何发现假货- 2018年欺诈影响者营销基准报告,s.l.:Captiv8。Cha,M.,Haddadi,H.,Benevenuto,F.,Gummadi,K.P.,2010.衡量Twitter的用户影响力:百万追随者谬误。s.l.,第四届AAAI博客和社交媒体国际会议。Constantinides,E.,2014年。社交媒体营销的基础程序- Soc. 行为举止。Sci. 148,40-57。Feehan,B.,2019. 2019年社交媒体行业基准报告。[在线]可在:(访问2020年2月1日)。Galhotra,S.,阿罗拉,A.,Virinchi,S.,罗伊,S.,2015. ASIM:独立级联模型下影响最大化的可扩展算法。In:ProceedingsK.R. Purba等人沙特国王大学学报2839第24届万维网国际会议Florence:ACM,pp. 35-36.戈亚尔,A.,卢伟,Lakshmanan,L.V.,2011. CELF++:优化社交网络中影响力最大化的贪婪算法。在:第20届国际会议上万维网伴侣的会议记录。s.l.:ACM,pp. 47比48古普塔,S.,马哈詹河,2019.微观影响者在影响行为意图中的作用。Int. J. 最新技术工程师:一八九至一九二Hamzehei,A.,例如,2016. TSIM:基于主题的社交网络社会影响力测量。第14届澳大利亚数据挖掘会议论文集。Canberra:ACM.Jendoubi,S.,马丁,A.,2019.病毒式行销之实证正面意见影响措施。知识和信息系统(KAIS)。s.l.:斯普林格。Karampourniotis警察局Szymanski,B.K.,Korniss,G.,2019.固定异构阈值的影响最大化。Sci. 众议员 9(5573)。Kempe,D.,Kleinberg,J.,Tardos,科罗拉多州,2003.通过社交网络最大限度地扩大影响力。第九届ACM SIGKDD知识发现和数据挖掘国际会议论文集。s.l.:ACM,pp.137-146。Kuhnle,A. 例如,2018年异质扩散模式下线上社交网络多重影响最大化。IEEE Trans.Comput.《社会系统》,第5卷(2),第418-429页。Lagrée,P.,Cappé,O.,Cautis,B.,Maniu,S.,2017.在线影响者营销的算法。arXiv:1702.05354 [引文SI]。Li , H. , 例 如 , 2019. DISCO : 影 响 力 最 大 化 满 足 网络 嵌 入 和 深 度 学 习 。 arXiv :1906.07378v1 [引文SI]。Li,M.,王,X.,Gao,K.,Zhang,S.,(1991),中国农业科学院,2017年。 在线社交网络中信息传播的研究:模型与方法。资料8(118)。李,Y.,范杰Ovchinnikov,G.V.,Karras,P.,2019年b.最大化多方面的网络影响力。澳门,中国,s.n..Moussaïd,M.,Kämmer,J.E.,Analytis,P.P.,Neth,H.,2013.社会影响和意见形成的集体动力。PLoSONE8(11),p.https://doi.org/10.1371/journal.pone.0078433.阮惠泰泰国,MT,丁,T.N.,2016.停止和凝视:十亿规模网络中病毒式营销的最佳抽样算法。2016年国际数据管理会议论文集。s.l.:S.N,pp. 695- 710Ogunyombo,O. E.,奥耶罗岛Azeez,K.,2017.社交媒体广告对尼日利亚三所大学本科生购买决策的影响。J. Commun. Media Res. 9,244-255.Panagopoulos,G.,Vazirgiannis,M.,Malliaros,F. D.,2018年通过表示学习实现影响最大化arXiv预印本arXiv:1904.08804。Purba,K.R.,Asirvatham,D.,Murugesan,R.K.,2020. instagram上新的流行度指标--局外人百分比的分析和预测模型。ICTExpress 6(3),243-248.Purba,K.R.,Asirvatham,D.,Murugesan,R.K.,2020年b。Instagram的帖子流行趋势分析和预测使用标签,图像评估,和用户历史功能. Int. Arab J. Informat. Technol.拉 博 岛 , 2018. 你 需 要 知 道 的 24 个 Instagram[ 在 线 ] 可 在 :https://blog.iconosquare.com/instagram-metrics/(访问2020年2月5日)。Rahman,Z.,Suberamanian,Moghavvemi,2017.社交媒体参与度指标对购买意愿的影响:以品牌粉丝页追随者为例。重新思考社会行动实践中的核心价值观,pp。665-681罗伦斯岛Baeckeb,P.,Benoita,D.,2016年。识别社交网络中的影响者德西斯Support Syst. 91,25-36. https://doi.org/10.1016/j.dss.2016.07.005。唐,Y.,施,Y.,Xiao,X.,2015.近线性时间中的影响最大化:鞅方法。2015年ACMSIGMOD数据管理Melbourne:ACM,pp.1539-1554
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 探索数据转换实验平台在设备装置中的应用
- 使用git-log-to-tikz.py将Git日志转换为TIKZ图形
- 小栗子源码2.9.3版本发布
- 使用Tinder-Hack-Client实现Tinder API交互
- Android Studio新模板:个性化Material Design导航抽屉
- React API分页模块:数据获取与页面管理
- C语言实现顺序表的动态分配方法
- 光催化分解水产氢固溶体催化剂制备技术揭秘
- VS2013环境下tinyxml库的32位与64位编译指南
- 网易云歌词情感分析系统实现与架构
- React应用展示GitHub用户详细信息及项目分析
- LayUI2.1.6帮助文档API功能详解
- 全栈开发实现的chatgpt应用可打包小程序/H5/App
- C++实现顺序表的动态内存分配技术
- Java制作水果格斗游戏:策略与随机性的结合
- 基于若依框架的后台管理系统开发实例解析
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功