假新闻图分析器：研究传播过程和抗模式的开源软件

139 浏览量更新于2024-01-25 收藏 356KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

软件影响10（2021）100182原始软件出版物假新闻图分析器：一个用于在大型扩散图放大图片创作者：J. J. 祝阿a香港城市大学传媒与传播系，香港b巴西里约热内卢里约热内卢联邦大学计算科学系，数学和自然科学中心---A R T I C L E I N F O关键词：假新闻社交网络传播过程图表分析TwitterA B标准在假新闻传播的研究中，必须了解不同类型的传播者在术语方面的差异它们的特性、相互联系和级联流。假新闻图分析器（FNGA）是一个开源软件，为大型图上的扩展分析提供所需的计算。此外，FNGA生成用于图形可视化的数据。此外，FNGA的设计考虑了假新闻和真新闻同时在图中传播，从而导致各种对抗模式。FNGA促进了未来对假新闻的研究，以及实体图中任何传染病的扩散代码元数据当前代码版本v1用于此代码版本的代码/存储库的永久链接https://github.com/SoftwareImpacts/SIMPAC-2021-156可再生胶囊的永久链接https://codeocean.com/capsule/7614966/tree/v1法律代码许可证MIT许可证使用GIT的代码版本控制系统使用Python的软件代码语言、工具和服务编译要求，操作环境依赖Python包：numpy，scipy，snap-stanford，xlrd如果有开发人员文档/手册的问题支持电子邮件abodaghi@cityu.edu.hk1. 介绍2016年美国总统大选后，假新闻在学术界引起了关注[1]。关于假新闻的快速增长的文献已经从各个方面研究了这一现象，其中对基于用户的特征的调查发挥了重要作用。基于用户特征的分析源于各种研究背景，从体育[2]到社交媒体[3]。但涉及传播假新闻或病毒式传染，用户的基本图表及其驱动的特征将在分析中发挥重要作用。特别是当涉及到假新闻在社交媒体上的传播过程建模时，考虑用户的基于图形的特征似乎是必要的[4，5]。当一个外部来源，特别是垃圾新闻网站，第一次发布假新闻帖子时，一些Twitter用户会获取并发布它[6]。然后转发者出现并传播假新闻。确切的过程发生在传播真相时，遇到了假新闻。因此，该剧的四个主要特点是假新闻的高音喇叭、假新闻的转高音喇叭、真相的高音喇叭、转高音喇叭真理之然而，一些推文者获得了大量的转发，使他们成为超级传播者，而许多相同内容的推文者发现他们的推文没有成功被任何人转发，最终成为不受欢迎的传播者。一个假新闻传播图是由所有这些不同类型的传播者的自我网络组成的。每个自我网络本身是由一个单一的传播者的所有追随者和追随者作为它的节点，而连接到传播者的有向边。本文中的代码（和数据）已由Code Ocean认证为可复制：（https://codeocean.com/）。更多关于生殖器的信息徽章倡议可在https://www.elsevier.com/physical-sciences-and-engineering/computer-science/journals上查阅。∗通讯作者。电子邮件地址：abodaghi@cityu.edu.hk（A. Bodaghi）。https://doi.org/10.1016/j.simpa.2021.100182接收日期：2021年11月12日;接受日期：2021年11月19日2665-9638/©2021作者。由Elsevier B.V.出版。这是一篇开放获取的文章，使用CC BY许可证（http://creativecommons.org/licenses/by/4.0/）。可在ScienceDirect上获得目录列表软件影响杂志首页：www.journals.elsevier.com/software-impactsA. Bodaghi，J.Oliveira和J.J.H.朱软件影响10（2021）10018222. 描述Fig. 1. 分析的结构。步骤2：提取不受欢迎的传播者的信息，包括计算一组特征，如FwFr，MFw和NTPY。第三步：FNGA1，2 是用python编写的，并使用诸如Snap之类的库-Stanford [7]，Numpy，and Scipy. 每个假新闻的输入是：1-扩散数据集（DD），包含与假新闻相关的所有推文的Excel文件。对于占据文件，为发布它的用户和tweet本身提供各种信息。用户的这些信息包括ID、#tweets、#followers、#followers、账户创建的数据和时间、语言和描述语句。虽然tweet的信息包括发布的日期和时间、#favorite、tweet的类型（可以是转发、引用、回复或原创）、tweet和用户ID 在推文是转发、引用或回复的情况下，推文在数据集中出现的频率，以及最后一个特征是推文的性质，其可以是假新闻（标记为“r”）、真相（标记为“a”）或仅仅是对假新闻的质疑（标记为“q”）。2-图数据集（DG），一个包含假新闻图的节点和边的图文件。实际上，可以通过应用SNAP的Python接口Snap.py来实现该文件，该接口为大图分析[7]提供了一个敏捷和轻量级的环境，以运行流程对每个假新闻传播者的关注者和关注者的原始列表型数据进行压缩和转换，以获得敏捷图数据集。通过这种方式，对于每个数据集，我们获得了一个有向网络，其中每个节点代表一个用户，并且从用户i如果i跟随j，则建立到用户j的ID。3-DG中的用户的ID，其被带入Jason 1文件中。在阅读输入后，软件将对每条假新闻进行六个分析步骤。Step1：提取转发者信息超级传播者的推文在超级传播者周围的不同距离圈处。事实上，首先是一组基于距离的类别，到超级传播者的定义，然后对于每个类别的成员，计算以下特征： 1- 追随者与追随者的比率（FwFr），2-相互追随者与一般追随者的比率（MFw），3-之前传播过最流行的推文的追随者的数量，作为给定成员的先行传播者（NA），4-从超级传播者传播最流行的推文的时间到给定成员转发该推文的时间所经过的秒数（TDS），第一先行传播者已经传播了最受欢迎的推文，直到给定成员转发该推文的时间（TDFA），6-来自给定成员的每年发布的推文和转发的数量（NTPY），其基于自账户创建以来的总体活动来计算，7-相反传染的先行传播者的数量，即在给定成员传播假新闻/真相之前已经是给定成员的追随者并且已经传播了真相/假新闻的用户（NAO）。在这一步，软件计算每个类别中用户的上述特征的平均值和标准差，并计算这些特征与每个类别的TDFA的相关性。1 https://github.com/AmirhoseinBodaghi/P9。2https://codeocean.com/capsule/7614966/tree/v1。通过Cytoscape生成图形可视化的输入文件。第四步：提取假新闻和真新闻的推主和转推者之间的互联信息。首先，该软件将用户分为四组：假新闻推特（FT），假新闻转发（FR），真相推特（TT）和真相转发（TR）。这些组的成员提取一系列信息，包括1-分数（对于给定的成员）是其他组的成员。 2-每一群的全部成员中跟随给定成员的部分。3-属于其他组的追随者（对于给定成员）的比例。4-每个组中所有成员中给定成员的追随者所占的比例。最后，我们计算每个类别成员的这些变量的平均值和标准差。第五步：提取每个假新闻图的一般信息，包括不同类型的节点和边的数量，三角形，三元组，连通分量以及有效直径的长度。第六步：提取假新闻和真新闻的推主和转发者的中心信息。这些中心性在单数水平（单个节点）和复数水平（类别的所有节点）计算。前者包括中心性，如页面排名，接近度，枢纽和权威评分，而后者包括模块性和每个组的内部链接与内部链接的比率，即FT，FR，TT和TR.这六个步骤中的每一个都提供了一个唯一的输出文件（.text文件），其中显示了结果。3. 影响FNGA能够对社交媒体驱动的假新闻图表进行广泛的分析。这些分析的总结可参见图1。1.一、该软件在最近的研究中进行的分析[8]证明了它能够揭示新的发现，以更好地了解社交媒体上的假新闻传播。此外，不同类别的中心性和传播者的相互联系的发现描绘了这是一个实用的视角，可以指导从业人员制定更好的策略来对抗社交媒体上的假新闻传播。此外，对集体行为的研究，如扩散的波动形式及其与微观行为的联系，仍处于起步阶段[9事实上，关于网络心理学影响的研究[12] 在总体层面上，仍然开放，以便对社交媒体中假新闻的传播过程产生更深刻的见解。该软件可以通过提供广泛的范围为此类研究铺平道路的分析。竞合利益作者声明，他们没有已知的竞争性财务利益或个人关系，可能会影响本文报告的工作A. Bodaghi，J.Oliveira和J.J.H.朱软件影响10（2021）1001823致谢这项研究由香港城市大学传播研究中心（编号：9360120）及香港数据科学研究所（编号：2009）资助。9360163）。引用[1]E. Tandoc，J. Jenkins，S.造假、假新闻、新闻实践。13（6）（2019）673[2]A. Bodaghi，一种新的普适计算方法，以提高步行活动的效率，健康技术。6（2016）269-276。[3]X. Zhang，中国古柏A. Ghorbani，在线假新闻概述：表征，检测和讨论，Inf. 过程管理。57（2）（2019）102025.[4]A. Bodaghi，S. Goliaei，一种考虑不同意见影响的社交网络谣言传播的新模型，Adv.ComplexSyst.21（2018）1850011，http://dx.doi.org/10.1142/S021952591850011X。[5]A. Bodaghi，S. Goliaei，M. 萨利希，以下人数作为一个在...中谣言传播中的影响因素，应用数学计算。 357 （2019）167-184。[6]A. Bondielli，F. Marcelloni，关于假新闻和谣言检测技术的调查，通知。Sci. 497（2019）38-55。[7] J.Leskovec，R. Sosic，Snap：一个通用的网络分析和图形挖掘库，ACM Trans. 内特尔系统Technol. （TIST）8（1）（2016）1.[8]A. Bodaghi，J.Oliveira，假新闻传播的剧院，谁扮演哪个角色？关于Twitter上传播的真实图的研究，专家系统应用（ 2021 ） 116110 ，http://dx.doi.org/10.1016/j.eswa.2021.116110。[9]A. Bodaghi，J. Oliveira，《生物多样性的特点》，谣言撒播机对笨蛋ter：对真实数据的定量分析，Comput. Commun. 160（2020）674-687。[10] P. Meel，D.K. Vishwakarma，基于时间集成的半监督ConvNet用于检测假新闻文章，专家系统应用。177（1）（2021）115002。[11] A. Choudhary，A. Arora，基于语言特征的假新闻检测和分类学习模型，专家系统。Appl. 169（1）（2021）11417.[12] Amirhosein Bodaghi，Jonice Oliveira，奥运冠军Instagram特征的纵向分析，社交网络分析。 Mining 12（ 1 ）（ 2022） http://dx.doi.org/10.1007/s13278-021-00838-9.

下载后可阅读完整内容，剩余1页未读，立即下载

cpongm

粉丝: 5
资源: 2万+

假新闻图分析器：研究传播过程和抗模式的开源软件

虚假新闻检测

fake-news:使用自然语言处理技术检测虚假新闻

DetectFakeNews:检测虚假新闻

请对开源软件在软件开发的各个阶段（如：需求获取、需求分析、概要设计、详细设计、开发编码、测试等，）中的影响和作用给出你的分析

名词解释：1.软件工程：2.软件过程： 3.配置管理： 4.缺陷密度： 5.基线：6.风险管理： 7.挣值分析 ：8.白盒测试：

简述整个软件生命周期中，各阶段软件体系结构的研究热点。

新闻分析系统国内研究现状

开源软件监测服务的目标

开源软件监测服务的内容

复杂网络信息传播研究方法

新闻分析系统国外研究现状

开源的 财务机器人模型

基于c++的语法分析器

软件工程研究方向和现状分析

网络的信息传播机制在信息传播机制的研究中是什么

基于flex和bison设计SysY语法分析器

写出如何设计递归下降语法分析器的过程

阿帕奇软件基金会（ASF）主要功能和明星开源项目分别为什么？

最新资源

名词解释：1.软件工程：2.软件过程： 3.配置管理： 4.缺陷密度： 5.基线：6.风险管理： 7.挣值分析：8.白盒测试：

开源的财务机器人模型