没有合适的资源?快使用搜索试试~ 我知道了~
2RELATED WORKTrack: Mining Attributed Networks WWW 2018, April 23-27, 2018, Lyon, France12950社交媒体中国家之间的信息传播路径0DidierHenry法属西印度群岛大学Pointe APitre,法国didier.henry@univ-antilles.fr0ErickStattner法属西印度群岛大学PointeAPitre,法国erick.stattner@univ-antilles.fr0MartineCollard法属西印度群岛大学Pointe APitre,法国martine.collard@univ-antilles.fr0摘要0如今,社交媒体是获得与多个主题相关的信息的最快途径之一。事实上,这些平台上的传播信息可以在几秒钟内传播数千公里,而新闻网站上发布的文章则不同。尽管已经进行了大量研究来了解信息在社交媒体中的传播速度和规模,但我们观察到他们尚未关注地理方面。在本文中,我们对2017年5月至6月之间传播的Twitter趋势进行了地理和时间分析。我们介绍了有关信息在国家之间传播路径的有趣模式。此外,我们还观察到了与主题相关的相关结果。最后,我们总结并给出了这项工作的研究展望。0关键词0社交网络;地理传播;信息扩散;数据分析0ACM参考格式:Didier Henry,Erick Stattner和MartineCollard。2018。社交媒体中国家之间的信息传播路径。在WWW '18Companion:2018年Web会议伴侣,2018年4月23日至27日,法国里昂。ACM,纽约,美国,4页。https://doi.org/10.1145/3184558.319156901 引言0如今,社交媒体在信息传播中占据重要地位。这些交流平台被世界上数百万人使用,每天发布数百万条信息。信息传播的影响可以在几秒钟内同时触达数百万人。为了量化信息的影响,一些研究人员对影响信息传播的参数感兴趣。事实上,这个领域有很多研究工作表明,用户本地网络的结构[8]、用户所属的社区数量[22]、用户在网络中的位置[13]和用户类别[4]都会影响信息的传播速度和数量。其他研究则侧重于传播的信息。在文献中,我们发现很多研究人员认为信息的极性[11]、主题[18]和内容[19]也会影响其传播。0本文根据知识共享署名4.0国际(CC BY4.0)许可发布。作者保留在个人和公司网站上传播作品的权利,并附上适当的归属。WWW '18 Companion,2018年4月23日至27日,法国里昂。© 2018IW3C2(国际万维网会议委员会),根据知识共享CC BY 4.0许可发布。ACM ISBN978-1-4503-5640-4/18/04。https://doi.org/10.1145/3184558.31915690尽管研究越来越深入地理解影响信息量和速度的因素,但受影响信息传播的地理维度仍然很少被研究。这是一个重要的参数,因为发布的信息可能根据其起始位置对人们产生潜在影响。我们认为对这个主题的更好了解可以帮助提出能够预测受信息影响的人的地理位置的模型。这样的模型在市场营销领域中可以用于针对特定受众。在另一个领域中,通过了解信息的下一个路径,可以在特定地理位置上减轻或停止谣言。出于所有这些原因,我们发现研究国家之间的信息传播路径非常有趣和创新。在本文中,我们对2017年5月至6月之间传播的2923个Twitter趋势进行了地理和时间分析。我们介绍了有关信息在国家之间传播路径的有趣观察,并考虑了主题。我们认为所有这些观察结果都可以用于建模任务。本文的其余部分如下所述:第2节介绍了有关信息扩散和地理数据分析的相关工作。第3节描述了提出的方法。第4节详细说明了观察结果。最后,第5节提出了我们的未来方向。0我们的工作处于社交媒体信息传播研究和社交媒体数据的地理分析两个研究领域的交叉点上。社交媒体中的信息传播:已经进行了各种各样的研究,以识别影响传播的参数,如体积[24](即多少)、速度[23](即多快)。一些研究者专注于用户社交网络。例如,Cheng等人[5]指出,原始广播者的本地网络结构对信息的传播范围有影响。此外,DeMeo等人[7]指出,弱关系增加了广播信息的传播范围。从传播速度的角度来看,Vega-Oliveros等人[21]指出,网络中心的个体能够比其他人更快地传播信息。其他研究专注于传播信息以了解传播过程。例如,Naveed等人[16]观察到负面信息传播比正面信息更快。根据另一个观察点,一些研究者[11]指出,正面信息的传播范围比中立和负面信息更广。其他研究表明,信息主题可能会影响传播。事实上,Son等人3PROPOSED APPROACH Country 1 Country 2 Country 3 Country 4 Country 5 Track: Mining Attributed Networks WWW 2018, April 23-27, 2018, Lyon, France12960al.[19]注意到社会对公司的批评或问题传播比促销或折扣更快。Myers等人[15]指出,有关娱乐、商业或健康的信息比艺术、教育或工作的信息具有更广泛的影响力。最后,几项研究[3,20]指出,消息文本中出现的字符或符号(如URL、hashtag)也可能对传播产生影响。社交媒体数据的地理分析:一些研究者[6]提出了一种基于用户推文内容纯粹估计Twitter用户城市级位置的方法,即使在没有任何其他地理空间线索的情况下。在同样的想法中,O'Connor等人[9,17]在他们的模型中使用带有地理标记的推文的词汇变化来对推文进行地理区域分类。其他研究者[1]在Facebook网络上进行了研究,并引入了一种算法来预测用户的物理位置,给定他的朋友的已知位置。另一项关于YouTube视频的地理空间属性的研究[2]表明了视频观看的高度本地化特性。一项与我们的工作相似的研究[14]表明,Twitter上的hashtag在时间上的采纳与空间距离接近的用户有关。在另一项研究[10]中,研究人员研究了63个美国主要地点的Twitter趋势的起源和路径。然而,据我们所知,该领域没有任何工作专注于国家之间的信息传播路径。0我们的目标是发现特定国家趋势出现的有趣模式。我们认为对真实数据的观察可以有助于提出模拟国家趋势出现的现实模型。首先,我们通过TwitterAPI在2017年5月29日至2017年6月15日期间,每五分钟收集了62个国家的50个Twitter趋势话题列表。基于一次是偶然,两次是巧合,三次是模式的想法,我们选择了在三天内至少在4个国家的趋势列表中出现的趋势。我们的数据集包含2923个符合此标准的趋势。其次,我们按照每个国家趋势的出现顺序进行了时间排序(见图1)。然后,我们根据其起源(即趋势首次出现的国家或国家)自动分类趋势。此外,我们根据以下8个主题手动分类趋势:人物、游戏、电影/电视、音乐、新闻、政治、体育和技术。我们还为其他主题的趋势添加了“其他”类别。第三步,我们为趋势路径中的每个国家提取了3个参数:采纳时间、传播时间和影响半径。前两个涉及时间维度,而第三个与地理方面有关。采纳时间是趋势在起源国家或国家出现和趋势在趋势路径中的国家出现之间经过的时间。传播时间是趋势首次出现在趋势列表中到其从列表中消失的经过时间。0日期 趋势1 趋势4 … 趋势50005:50 01/06/2017 #Google涂鸦 #行动应对气候变化 #CoderfactoryVR005:55 01/06/2017 #Google涂鸦 #Sense8 #CoderfactoryVR006:00 01/06/2017 #Google涂鸦 #Sense8 #CoderfactoryVR0日期 趋势1 趋势14 … 趋势50005:50 01/06/2017 #火车相撞 #图书博览会 Yaya Toure005:55 01/06/2017 #火车相撞 #Sense8 Yaya Toure006:00 01/06/2017 #火车相撞 #Sense8 Yaya Toure0日期 趋势1 趋势2 … 趋势50005:10 01/06/2017 #世界牛奶日 #NBA总决赛 #第25章005:15 01/06/2017 #Sense8 #世界牛奶日 #第25章005:20 01/06/2017 #Sense8 #世界牛奶日 #第25章0日期 趋势1 趋势8 … 趋势50006:40 01/06/2017 #气候变化 东方快车 Gal Gadot006:45 01/06/2017 #气候变化 #Sense8 Gal Gadot006:50 01/06/2017 #气候变化 #Sense8 Gal Gadot0日期 趋势1 趋势2 … 趋势50007:00 01/06/2017 #巴黎协定 Griezmann Mbappe007:05 01/06/2017 #巴黎协定 #Sense8 Mbappe007:10 01/06/2017 #巴黎协定 #Sense8 Mbappe0T0 国家10趋势:#Sense80国家20国家30T10国家40国家50T20T30图1:趋势提取的方法0影响半径是趋势起源国首都与趋势路径中某个国家首都之间的地理距离04观察0首先,我们观察了趋势主题和趋势起源国的数据分布。我们注意到越南、美国、白俄罗斯和英国是一半趋势的起源国。此外,我们注意到体育似乎是一个重要的Twitter热门话题。其次,我们观察了趋势路径的长度,也就是受影响国家的数量与趋势起源和主题相关。例如,我们注意到与技术相关的趋势似乎影响的国家比其他主题更多(见图3)。此外,我们注意到受趋势影响的国家数量似乎受到趋势起源国的影响(见图2)。因此,趋势路径的长度既取决于主题又取决于趋势起源。因此,这两个参数应该纳入模型考虑。此外,我们注意到一些国家从不在特定主题上采用首个趋势。例如,我们注意到只有40%的国家是有关人物的趋势的起源国(见图4)。然后,我们对数据的时间方面感兴趣。我们观察了采用时间和感染时间与主题的关系。我们注意到采用时间根据主题不同而不同。例如,我们注意到与游戏相关的趋势的采用时间比其他主题更短(见图5)。通过观察感染时间,我们注意到它根据主题而有所变化。此外,我们看到趋势起源国的感染时间比趋势路径中的其他国家更长,例如人物、电影、政治和体育等主题(见图6)。因此,采用时间和感染时间也是应该纳入模型的两个参数。接下来,我们观察了影响半径随主题的变化。我们注意到这个参数也根据主题而变化(见图7)。虽然我们没有呈现采用时间、感染时间和影响半径的观察结果,但我们注意到这些参数也会根据主题而变化。024681012141618VIETNAMUNITED STATESBELARUSUNITED KINGDOMLATVIAINDIACANADASPAINAUSTRALIABRAZILFRANCEPHILIPPINESARGENTINAMEXICOIRELANDKENYAVENEZUELAPAKISTANITALY0246810121416180,00%20,00%40,00%60,00%80,00%100,00%120,00%020004000600080001000012000T0T1T2T30200040006000800010000120001400016000T0T1T2T3020004000600080001000012000T0T1T2T3T4Track: Mining Attributed Networks WWW 2018, April 23-27, 2018, Lyon, France12970路径长度0图2:根据起源国家的趋势的中位数路径长度(趋势数量>1%)。0路径长度0平均 中位数0图3:根据主题的趋势的中位数和平均路径长度。0图4:根据主题,首先采纳趋势的国家的百分比。0根据趋势的起源,我们注意到这些参数的值取决于起源国家。因此,采纳时间、感染时间和影响半径应该考虑在建模任务中。最后,我们对信息的传播路径感兴趣。我们使用SPMF工具[12]中的Apriori和Fournier算法来发现频繁项集和序列模式。我们对数据进行了多次实验。我们在这里呈现结果。0时间(秒)0图5:根据主题的中位数采纳时间。0时间(秒)0图6:根据主题的中位数感染时间。0距离(公里)0人物 游戏 电影/电视0音乐 新闻 其他0政治 运动 科技0图7:根据主题的中位数影响半径。0在这里,我们观察到在越南、美国、白俄罗斯和英国出现了一些趋势,最小支持度设为40%,不考虑主题。我们注意到,经常有一些国家:白俄罗斯、拉脱维亚、波多黎各、美国和越南,无论主题和趋势的起源地是什么,它们经常一起受到影响(见表1)。然后,我们提取了这些国家的序列模式。我们在这里介绍将最小支持度设为20%时得到的结果。我们观察到在趋势的采纳中存在时间序列(见表2),换句话说,国家之间的趋势出现有频繁的路径。05 结论和展望0据我们所知,这项工作是关于社交媒体中国家之间信息传播的首次研究。12980表1:支持度最小值≥40%的项集。0趋势的起源 项集0白俄罗斯 {白俄罗斯,拉脱维亚,越南} 55% {白俄罗斯,波多黎各,越南} 65% {白俄罗斯,美国,越南} 48%0英国 {白俄罗斯,波多黎各,英国} 47%0(UK) {白俄罗斯,波多黎各,越南} 47% {白俄罗斯,越南,英国} 84%{波多黎各,英国,越南} 56% {白俄罗斯,波多黎各,英国,越南} 47%0美国 {白俄罗斯,拉脱维亚,美国} 44%0(US) {白俄罗斯,拉脱维亚,越南} 44% {白俄罗斯,波多黎各,美国}49% {白俄罗斯,波多黎各,越南} 49% {白俄罗斯,美国,越南} 85%{拉脱维亚,美国,越南} 46% {波多黎各,美国,越南} 58%{白俄罗斯,拉脱维亚,美国,越南} 43% {白俄罗斯,波多黎各,美国,越南}49%0越南 {白俄罗斯,拉脱维亚,越南} 46% {白俄罗斯,波多黎各,越南}53% {白俄罗斯,美国,越南} 46%0表2:支持度最小值≥20%的序列。0趋势的起源 序列0白俄罗斯 T0: 白俄罗斯 拉脱维亚 23% T0: 白俄罗斯 T1: 越南 29%T0: 白俄罗斯 波多黎各 越南 31% T0: 白俄罗斯 越南 67%0英国 T0: 英国 T1: 白俄罗斯 29%0(UK) T0: 英国 T2: 白俄罗斯 25% T0: 英国 T1: 越南 T2: 白俄罗斯20% T0: 英国 T1: 越南 53%0美国 T0: 美国 T1: 白俄罗斯 30%0(US) T0: 美国 T2: 白俄罗斯 22% T0: 美国 T1: 越南48% T0: 美国 越南 38%0越南 T0: 越南 波多黎各 29% T0: 越南 美国 26% T0: 越南T1: 白俄罗斯 31%0在本文中,我们讨论了信息在国家之间的传播。我们的贡献可以总结如下。0(1)我们提出了一种从Twitter上提取与趋势相关的国家之间路径采纳的方法。(2)第一项研究观察到,趋势的路径采纳长度根据主题和趋势的起源地而变化。此外,我们发现有些国家在特定主题上从不首先采纳趋势。(3)在第二步中,我们注意到感染时间、采纳时间和趋势的影响半径根据主题和趋势的起源地而变化。此外,我们还注意到,首先采纳趋势的国家在某些主题上似乎具有较长的感染时间。(4)第三,我们注意到,无论主题和趋势的起源地如何,一些国家经常一起受到影响。此外,我们观察到,在国家采纳趋势的过程中,存在频繁的时间序列。0在即将进行的研究中,我们计划提出一个模型,该模型考虑了趋势的主题、趋势的起源地、采纳时间、感染时间和影响半径,以便0预测受趋势影响的国家和采纳顺序。0参考文献0[1] Lars Backstrom, Eric Sun, and Cameron Marlow. 2010. Find me if you can:improving geographical prediction with social and spatial proximity. In Proceedingsof the 19th international conference on World wide web. ACM, 61–70. [2] AndersBrodersen, Salvatore Scellato, and Mirjam Wattenhofer. 2012. Youtube around theworld: geographic popularity of videos. In Proceedings of the 21st internationalconference on World Wide Web. ACM, 241–250. [3] Carlos Castillo, MarceloMendoza, and Barbara Poblete. 2011. Information credibility on twitter. InProceedings of the 20th international conference on World wide web. ACM,675–684. [4] Meeyoung Cha, Hamed Haddadi, Fabricio Benevenuto, and P KrishnaGummadi. 2010. Measuring User Influence in Twitter: The Million Follower Fallacy.ICWSM 10, 10-17 (2010), 30. [5] Justin Cheng, Lada Adamic, P Alex Dow, JonMichael Kleinberg, and Jure Leskovec. 2014. Can cascades be predicted?. InProceedings of the 23rd international conference on World wide web. ACM,925–936. [6] Zhiyuan Cheng, James Caverlee, and Kyumin Lee. 2010. You are whereyou tweet: a content-based approach to geo-locating twitter users. In Proceedingsof the 19th ACM international conference on Information and knowledgemanagement. ACM, 759–768. [7] Pasquale De Meo, Emilio Ferrara, GiacomoFiumara, and Alessandro Provetti. 2014. On Facebook, most ties are weak. Commun.ACM 57, 11 (2014), 78–84. [8] P Alex Dow, Lada A Adamic, and Adrien Friggeri. 2013.The Anatomy of Large Facebook Cascades.. In ICWSM. [9] Jacob Eisenstein, BrendanO’Connor, Noah A Smith, and Eric P Xing. 2010. A latent variable model forgeographic lexical variation. In Proceedings of the 2010 Conference on EmpiricalMethods in Natural Language Processing. Association for Computational Linguistics,1277–1287. [10] Emilio Ferrara, Onur Varol, Filippo Menczer, and AlessandroFlammini. 2013. Traveling trends: social butterflies or frequent fliers?. In Proceedingsof the first ACM conference on Online social networks. ACM, 213–222. [11] EmilioFerrara and Zeyao Yang. 2015. Quantifying the effect of sentiment on informationdiffusion in social media. PeerJ Computer Science 1 (2015), e26. [12] PhilippeFournier-Viger, Jerry Chun-Wei Lin, Antonio Gomariz, Ted Gueniche, Azadeh Soltani,Zhihong Deng, and Hoang Thanh Lam. 2016. The SPMF Open- Source Data MiningLibrary Version 2. In Joint European Conference on Machine Learning andKnowledge Discovery in Databases. Springer, 36–40. [13] Caroline Haythornthwaite.1996. Social network analysis: An approach and technique for the study ofinformation exchange. Library & information science research 18, 4 (1996), 323–342.[14] Krishna Y Kamath, James Caverlee, Kyumin Lee, and Zhiyuan Cheng. 2013.Spatio- temporal dynamics of online memes: a study of geo-tagged tweets. InProceedings of the 22nd international conference on World Wide Web. ACM,667–678. [15] Seth A Myers, Chenguang Zhu, and Jure Leskovec. 2012. Informationdiffusion and external influence in networks. In Proceedings of the 18th ACMSIGKDD international conference on Knowledge discovery and data mining. ACM,33–41. [16] Nasir Naveed, Thomas Gottron, Jérôme Kunegis, and Arifah Che Alhadi.2011. Bad news travel fast: A content-based analysis of interestingness on twitter. InProceedings of the 3rd International Web Science Conference. ACM, 8. [17] BrendanO’Connor, Jacob Eisenstein, Eric P Xing, and Noah A Smith. 2010. Discoveringdemographic language variation. (2010). [18] Daniel M. Romero, Brendan Meeder,and Jon M. Kleinberg. 2011. Differences in the mechanics of information diffusionacross topics: idioms, political hashtags, and complex contagion on twitter. InWWW. ACM, 695–704. [19] Insoo Son, Dongwon Lee, and Youngkyu Kim. 2013.Understanding the Effect of Message Content and User Identity on InformationDiffusion in Online Social Networks.. In PACIS. 8. [20] Bongwon Suh, Lichan Hong,Peter Pirolli, and Ed H Chi. 2010. Want to be retweeted? large scale analytics onfactors impacting retweet in twitter network. In Social computing (socialcom), 2010ieee second international conference on. IEEE, 177–184. [21] Didier A Vega-Oliveros,Luciano da F Costa, and Francisco A Rodrigues. 2016. Rumor propagation withheterogeneous transmission in social networks. arXiv preprint arXiv:1610.01012(2016). [22] Lilian Weng, Filippo Menczer, and Yong-Yeol Ahn. 2014. Predictingsuccessful memes using network and community structure. arXiv preprintarXiv:1403.6199 (2014). [23] Shaomei Wu, Chenhao Tan, Jon M Kleinberg, andMichael W Macy. 2011. Does Bad News Go Away Faster?. In ICWSM. Citeseer. [24]Jiang Yang and Scott Counts. 2010. Predicting the Speed, Scale, and Range ofInformation Diffusion in Twitter. ICWSM 10 (2010), 355–358.0会议名称: 2018年WWW挖掘属性网络, 2018年4月23日至27日, 法国里昂
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 黑板风格计算机毕业答辩PPT模板下载
- CodeSandbox实现ListView快速创建指南
- Node.js脚本实现WXR文件到Postgres数据库帖子导入
- 清新简约创意三角毕业论文答辩PPT模板
- DISCORD-JS-CRUD:提升 Discord 机器人开发体验
- Node.js v4.3.2版本Linux ARM64平台运行时环境发布
- SQLight:C++11编写的轻量级MySQL客户端
- 计算机专业毕业论文答辩PPT模板
- Wireshark网络抓包工具的使用与数据包解析
- Wild Match Map: JavaScript中实现通配符映射与事件绑定
- 毕业答辩利器:蝶恋花毕业设计PPT模板
- Node.js深度解析:高性能Web服务器与实时应用构建
- 掌握深度图技术:游戏开发中的绚丽应用案例
- Dart语言的HTTP扩展包功能详解
- MoonMaker: 投资组合加固神器,助力$GME投资者登月
- 计算机毕业设计答辩PPT模板下载
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功