社交网络中假新闻的调查与检测方法

171 浏览量更新于2024-01-17 收藏 1.92MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

制作和主办：Elsevier沙特国王大学学报社交网络中假新闻的综合调查：属性，特征和检测方法Medeswara Rao Kondamudia，Somya Ranjan Sahooa，Lokesh Chouhanb，Nandakishor Yadavca计算机科学学院，VIT-AP大学，AP秘书处旁边Amaravati，Vijayawada，Andhra Pradesh 522237，印度b印度政府内政部国家法医科学大学，印度果阿邦达库尔蒂，邮编403401c德国德累斯顿弗劳恩霍夫光子微系统研究所阿提奇莱因福奥文章历史记录：2022年11月22日收到2023年4月2日修订2023年4月22日接受2023年5月4日网上发售保留字：在线社交网络假新闻分类假新闻识别技术A B S T R A C T近几十年来，在线社交网络的爆炸式增长极大地改善了人们相互交流的方式。人们对社交网络的信任是直截了当的，而不知道通过这些网络传递的信息的来源和一致性。有时，在线社交网络上不可靠的信息误导了观众，给人类带来了无法消除的污点。在线社交网络甚至改变了政府原有的信息，这在民众中造成了混乱，民众对政府失去了信心。已经进行了各种类型的研究，以高效率地识别假新闻。在本调查中，我们描述了假新闻的基本理论，调查和分析了对假新闻的看法，误导性信息的属性，对虚假信息的深入分析，以及已经建立的检测方法。据我们所知，这篇研究文章将有助于促进技术专家、政治活动、在线购买和其他用于调查虚假消息的学科之间的合作活动版权所有2023作者。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。内容1.介绍21.1.社交网络上的信息类型1.2.传播假新闻31.3.识别假新闻的重要性41.4.第4条的意图和成就1.5.调查的范围和组织.2.假新闻的特点2.1.假新闻的新闻内容2.2.假新闻的社会背景2.3.假新闻的创造者及其意图72.4.第8节摘要3.基于新闻内容的假新闻83.1.基于语言和语义的分析3.2.基于知识的分析3.2.1.人工事实核查9*通讯作者。电子邮件地址：vitap.ac.in（M.R. Kondamudi），somyaranjan. vitap.ac.in（S.R. Sahoo），nandakishor. ipms.fraunhofer.de（N. Yadav）。沙特国王大学负责同行审查https://doi.org/10.1016/j.jksuci.2023.1015711319-1578/©2023作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页：www.sciencedirect.comM.R. Kondamudi，S.R.萨胡湖Chouhan等人沙特国王大学学报23.2.2.自动事实核查93.3.第11款摘要4.风格分析114.1.假新闻的风格表现4.1.1.基于文本的新闻124.1.2.图片新闻124.2.基于风格的假新闻内容模式124.3.第13款摘要5.用于假新闻识别的特征分析135.1.新闻内容特色135.2.基于社会背景的特征145.3.基于用户的功能145.4.第15款摘要6.识别假新闻和检测方法156.1.第三方虚假新闻识别服务156.2.不同的假新闻识别166.3.机器学习方法检测假新闻176.4.基于深度学习的假新闻检测方法206.5.几何深度学习6.6.第20款摘要7.用于假新闻检测的数据集208.本调查与现有调查的比较229.讨论和今后的研究方向10.结论23竞争利益声明参考文献231. 介绍假新闻不是最近的发展;它存在于基督之前（公元前）（梅森等人，2018年）。传播始于1439年（Jacobet al.，2016年）。它在报纸文章、电视和其他一些传统媒体中越来越普遍。在此之后，万维网（WWW）的开发在20世纪90年代中期得到了显著的发展。由于其方便、快速和低成本，社交媒体已经成为在线人类互动和信息传输的主要媒介（Shu et al.，201 7 年b）。假新闻被定义为 “被改变的真相”，这表明媒体的动机是真实的（Shrivastava等人， 2020年）。在2016年美国大选的关键日子里，假新闻的传播是显而易见的。总统选举（克雷格·西尔弗曼，2016）。在此期间，创建了1900万个机器人配置文件，以传播有关特朗普和克林顿的假新闻（Sansonetti等人， 2020 年）。虽然，有 8， 711， 000Facebook的股票，评论和意见，20个最受欢迎的讨论虚假的文章和评论。此外，超过了19家主要媒体组织为20位备受争议的总统候选人提供的7，367，000份（克雷格·西尔弗曼，2016）。大约三分之二的美国人从互联网来源获取信息，这一比例正在稳步上升（ JefferyGottfried，2016）。这些来源被用来传播假新闻，假营销，假谣言，假政治评论，恶搞等等。除传统平台外，假新闻在社交媒体上越来越普遍和频繁传播（Rapoza，2017）。举个例子，想想马其顿城镇韦莱斯的数百名年轻人。谁在共享的大众媒体上制作针对许多人的虚假信息，然后在整个美国总统大选期间通过点击付费宣传致富（Smith和假新闻主要吸引那些更多地参与政治对话和全球市场价值观的个人的兴趣，它可能会对他们的心理健康产生影响它也会对人民和政府产生可怕的影响。此外，据报道，假新闻在社交媒体上获得更多的观点而不是实际的新闻，这一说法的证据出现在成熟的社交媒体网站上。假新闻的情况比其他类型的数据更严重此外，由于假新闻的重复特征，人们开始相信它，无论它是否支持他们现有的信念（Zhou和Zafarani，2020）。这种感知和态度偶尔会受到社会条件的影响（Rohera et al.，2022年a）。假新闻是故意制造出来的，通过操纵事实和数据来愚弄人们.许多真实欲望的模式被模仿为假新闻来欺骗公众（Shu等人，2017年a）。有例如，2020年）。尽管努力识别假新闻，但互联网上有各种在线事实核查服务，例如如FactCheck.org和PoltiFact.com，并且还存在更多的由专家进行的人工识别程序。此外，这些方法受到各种新闻分类和模式的限制（Zhang和Xichen，2020）。此外，大量令人难以置信的虚假材料通过在线社交网络制造和发布。1.1. 社交网络上的信息类型根据社交媒体上提供的信息，数据分为四个主要类别。这些是事实的基本组成部分图 1，我们描述了信息的类别，Fig. 1. 在线社交网络上的信息类型。M.R. Kondamudi，S.R.萨胡湖Chouhan等人沙特国王大学学报3通过在线社交媒体相互交流。这些是信息的超链接、图像、音频和文本版本，如下所示。文本：写作是口语的一个子类别，主要是用文本或字符串来学习内容。它主要关注人与人之间的沟通。语篇多媒体：顾名思义，它结合了许多媒体技术。这包括电影，听觉和现实的图片。这似乎是非常有吸引力的，并立即引起客户超链接或嵌入内容：通过展示新闻项目的想法，链接有助于连接支持作者和提高观众信任度的几个基础（例如，推特、Facebook帖子、YouTube剪辑、Instagram帖子等）。音频：新闻传播的方式也是通过在线社交媒体的音频格式这一消息在传播中吸引了更多人1.2. 传播假新闻没有理由在社交媒体上发布误导性信息。作为假新闻基础的可靠而准确的解释只能基于调查和估计研究。假新闻问题影响着整个世界，随着人们对社会网络新闻的关注，假新闻的传播范围也越来越广。这种情况提出了一个问题，为什么假新闻变得更有吸引力（Zhou和Zafarani，2018）。假新闻在社交媒体平台上迅速传播（Zannettou等人，2019年）。有各种传播假新闻的详细如下所示以知识为基础：通过利用被称为事实核查的技术，人们试图在从基于知识的方法调查虚假宣传的同时检查和/或发现虚假新闻。通过对知识库的事实核查，比较从信息中提取的知识它分为手动事实检查（第3.1节中提到）和自动事实检查（第3.2节中提到）。基于风格：有几个关键的假设，以检查的语气和内容的误导性信息，不同于合法的报告。例如，事实检测指示更大的视觉输入可以表示真实的发生（Tai等人， 2020年）。基于用户：虚假信息通过用户生成的内容在社交媒体平台上传播。首先，未经授权的用户发布了不正确的信息。这些用户经常被称为“天真的观众”，因为他们的参与是无意的，并受到社会或身份问题的影响。其次，虚假信息是由个人为了获得利润而故意产生和传播的（Kang等人， 2022年）。基于简化：作者（Roets，2017）描述了真实世界的例子可以帮助简化传播。例如，符号学反射、反冲现象和保守偏见表明，虚假信息是错误的，难以纠正。作者（Xiong et al.，2020年）将其定义为伪造故事的独特实例，通常具有政治方面，并试图损害第三方提供商的利益。这种误导性的信息已经发生，并在第二次世界大战期间普遍使用。宣传是误导的一个主要例子，改变人们生活轨迹的力量关于2018年叙利亚爆炸事件的新闻以及像“黑人的生命也是物质的”这样的步法训练基于讽刺的新闻：作者（Golbeck等人，2018）提到了讽刺新闻中涉及的喜剧和讽刺，以及社交媒体用户对此类新闻的吸引力。洋葱（TheOnion，2016）和石板是两个著名的网站，发布模仿新闻和讽刺新闻（Satirewire，2018）。这样的网站通常会在他们的一个页面上明确他们的讽刺性质（即，关于页面）。这些信息经常通过社交媒体分享，用户无需检查即可阅读这些内容。基于恶作剧的新闻：作者（Kumar等人，2016年）将基于恶作剧的新闻描述为有目的地创造的不真实，在社交媒体中呈现为事实。在研究领域和信息片段的背景下，这些信息被称为虚假的人类死亡在恶作剧新闻中得到了强调，例如，A fake fun- eral forAdam Sadler（Snopes，2017）.基于谣言的消息：作者（Li et al.，2022a）描述了在线社交网络人传播其真实性受到质疑或未经验证的基于谣言的新闻。作者（Mikkelson，2018）提到9/11，一名儿童在桑迪胡克小学被杀，2013年波士顿马拉松爆炸案的嫌疑人成为公民。基于点击诱饵的新闻：作者（Rajapaksha等人， 2021）将基于点击诱饵的新闻作为误导性的标题和在线内容中的图片，并系统地利用这些内容并不新颖，它最初出现在几十年前的“报纸时代”，并且该运动被称为“黄色新闻”（John J. Pauly，2002）。虽然越来越多的OSN正在增长，但这个问题越来越严重，因为用户在其内容中添加虚假描述以增加访问者并赚钱或变得流行。基于垃圾新闻的新闻：垃圾新闻以宣传的形式通过社交媒体平台流动，造成大量的错误信息（Sahoo等人，第2022条b款）。在密歇根州，Twitter上的政治讨论更多地使用了此外，垃圾新闻是由自动化过程推广的，这些服务管理员无法清楚地解释新闻是如何分发的（Xu et al.，第2022条b款）。基于转推的新闻：人们经常使用转推来传播吸引和影响在线用户的重要信息作者（Kogan等人，2015年）提出，这些在社交媒体平台上的转发是巨大的。转发是用户发明的功能，它不是Twitter平台的一部分一条转推显示了初始推文的当前阶段，以及它被转推的次数，这些计数基于上下文和数据集。操纵基于照片/视频的新闻：在线社交媒体平台上的图片和视频信息也在传播假新闻方面发挥了作用。它包括政治，体育，娱乐，时事等新闻（Ansar和Goswami，2021）。因此，为了误导读者，图片可能会改变颜色，亮度，清晰度和位置。它也可以被裁剪或与其他照片相结合，以生成操纵图像。可以基于流质量、快门速度和其他元素来修改记录（Sahoo等人，2022年a）。因为没有法律禁止在在线社交网络中修改图片或盗窃照片。例如，德里首席部长Aravind Kejriwal在旁遮普2017年州议会上发表讲话的视频被数字化修改，使他看起来像酒鬼。在另一个例子中，一面●●●●●●●●●●●●●●●M.R. Kondamudi，S.R.萨胡湖Chouhan等人沙特国王大学学报4在2020年美国总统大选之前，德克萨斯州的船展期间发生了这件事。我们根据某些特征来代表假新闻，对其合法性和目的进行分类，并确定它是否是假的。我们强调了基于先前研究的几个错误报告，如表1所示。1.3. 识别假新闻许多组织正在寻找预防性的方法来控制网络上的虚假信息例如，Facebook公司已经启用了事实检查来标记其用户共享的内容中的欺骗（Mosseri，2016）。谷歌推出了一个名为“谷歌新闻倡议”的新网络应用程序它还可以教观众如何识别虚假新闻和故事（ TaraDeschamps，2018）。作者（Zhou和Zafarani，2020）分析了不同的假新闻识别算法，并从几个角度检查了虚假信息。作者（Zubiaga等人，2018）提出了几项研究，用于识别社交网络网站上的假新闻和谣言。众多的虚假新闻检测系统提供了一种新的解决方案（Sansonetti等人，2020年）。作者（Katsaros等人， 2019）测试了用于检测假新闻的各种最佳机器学习。作者进行了相同的研究（Agarwal等人，2019年，用于检测虚假信息。作者（Jiangetal.，2021）讨论了一些更多的机器学习技术，这些技术可以用于检测虚假信息并表征在（Kaliyar et al.，2021年a）。假新闻的身份描述如下：假新闻的速度：作者（Velichety和Shrivastava，2022; Allcott和Gentzkow，2017）提到，假新闻可以在不同的网站上发布，例如denver-denveran.com。讽刺网站新闻看起来像真正的新闻，这是在wtoe5news.com和endingthefed.com观察。在2016年美国总统选举期间，这类网站开始提供虚假信息。然后，在韦莱斯小镇年轻人的监督下，假新闻在100多个网站上传播。例如，一名24岁的罗马尼亚人正在维护一个名为Endingthefed.com的网站。它在Facebook上产生了十分之四的广泛分享的假新闻此外，据报道，美国一家公司Disinfomedia雇佣了20至25名撰稿人为NationalReport.net、USAToday.com.co和WashingtonPost.com.co制作虚假新闻。在社交网站上传播错误信息假新闻的数量：互联网用户可以在没有任何认证的情况下在在线社交网络上发布不正确的信息（Tai等人， 2020年）。于二零一六年一月一日至二零一六年十二月三十一日期间，总统表1不同的假新闻在网络社交网络上传播在2017年的选举中，65个网站的浏览量为1.59亿次，占18岁美国人的62%，并且过度阅读或访问了通过社交网站获得的新闻（Allcott和Gentzkow，2017）。此外，关于医疗保健问题的误导性信息在在线社交网络上传播的数量在（Sotto et al.，2022;Naboz_ny等人， 2022年）。假新闻的准确性：对假新闻的解释有很多，包括八卦、喜剧新闻、误传、不实信息、虚假评论和立法者的欺骗性言论。这些都影响到人们日常生活的各个方面。此外，随着数字平台的日益普及，虚假信息可能会影响在线用户的想法和结论。某些假新闻是故意制造的，目的是在社交媒体上误导人们，特别是年轻的学习者和缺乏意识的老年人（Khan和Michalas，2021）。在2010年智利地震期间，多个报告在Twitter上流传，引起了广泛的恐惧和不确定性（Alrubaian等人， 2016年）。2019年，Facebook的一篇帖子使用电视收视率数据做出虚假声明，称有线电视新闻网（ CNN ）不在十大收视率最高的电视网络之列（Fichera，2019）。其他一些虚假的科学文章声称，物理学家斯蒂芬霍金曾警告过例如，88%的买家信任互联网评估，72%的人强烈相信有隐性反馈的公司（Tai等人， 2020年）。另一个例子是2016年美国总统竞选大量虚假的俄罗斯个人资料在整个选举期间发布了反克林顿的推文，如选民很容易受到虚假信息的影响有些人甚至会分享虚假信息或自己对虚假新闻做出反应（Li等人，2022 c）。这些信息可能为对大量虚假信息进行定性和定量研究提供了新的机会（Jiang等人， 2021年）。假新闻在今天的互联网上仍然很普遍，对社区、政治家、技术支持者和金融市场造成了严重破坏，也对生活在受信誉危机困扰的数字世界中的任何人造成大量的假新闻已经通过OSN快速准确地传播，如图所示。二、1.4. 本文的写作意图与成就收视率最高的新闻被视为对社区、政治、媒体等最严重的挑战之一（Jianget al.， 2021年）。作者（Willmore，2016）描述了2016年发生的几起事件，这些事件在美国总统选举期间通过合法通信和在线网站传播虚假信息在网上虚假新闻产生的8，711，000条回应，评论和观点中，约有7，367，000条是由主要新闻机构上传的竞选故事产生的由于假消息的传播假新闻的类型合法性目的传播成为新闻不熟悉不道德当然基于谣言的不熟悉的不熟悉的垃圾新闻基于肯定不道德肯定骗局基于肯定不熟悉的不熟悉的基于肯定不道德肯定假新闻基于肯定不道德肯定宣传基于肯定不道德肯定错误信息基于不真实不熟悉的不熟悉的恶意基于不真实不道德肯定错误信息基于不真实不道德不熟悉的处理照片/视频当然不是不道德的陌生人图二、假新闻的数量，准确性和速度。●●●M.R. Kondamudi，S.R.萨胡湖Chouhan等人沙特国王大学学报5关于巴拉克·奥巴马因事故住院治疗，正在寻找识别在线欺诈数据的新方法。为了解决误导性信息，错误信息和有问题的新闻问题，谷歌推出了一个基于网络的应用程序，称为这项工作将在未来几年花费3.92亿美元，并可以提高人们订阅更高水平期刊的能力。此外，指导人们如何识别虚假的故事和信息。开发一个系统，即使在没有异常样本的情况下也可以识别不规则的新闻或可疑的网络材料（ Tara Deschamps ，2018）。为了提供一种即使不存在异常样本也能够检测异常或可疑在线内容的系统（Zhao等人，2014年）。某些调查文章还探讨了检测虚假互联网新闻和不准确信息的问题。作者（Sansonetti等人，2020年）提到，社交媒体上的假新闻的自动识别是可用的。他们对从社会和行为研究的角度来描述假新闻特别感兴趣。作者（Sheikhi，2021; Jain等人，2021）描述说，他们主要探讨误导性新闻如何在互联网上传播，以及如何操纵在线观众。研究人员还估计了误导性数据的后果，并描述了某些有效的虚假信息检测方法。作者（Shang，2019 a）描述了动态网络中针对经典入侵的适应性合作，当威胁被限制在每组正常节点中时，就会发生，并且创造了充分和必要的条件来确保接受。作者（Shang，2019b）提出了动态网络这包括对特定主题的私人意见和公开意见此外，作为评估技术的一个组成部分，通过对比其他研究的其他研究结果，最受认可的期刊、会议记录和研究论文都包含在文献调查的独家电子数据库中。在最初的检索中检测到320篇文章，然而，在应用纳入-排除标准后，仅考虑了218篇文章。3.第三章。1.5. 调查的范围和组织我们简要解释，社交媒体平台的日益普及虽然它们在收集有价值的信息方面的价值是显而易见的，但它们的可获得性、缺乏监测以及信息可在任何时间和任何地点分享的简单性，肯定对信息保证提出了严重挑战认识到假新闻传播可能产生的不便和潜在危害，近年来开发各种处理假新闻的工具的动机在这次调查中，我们描述了虚假信息在在线社交网络上传播的多种方式，如何识别它，以及如何彻底分析它应首先确定虚假信息来源的语言性质。图4代表了不同技术的假新闻属性，特征和检测方法的层次结构。图三. 检索词和排除标准的趋势。M.R. Kondamudi，S.R.萨胡湖Chouhan等人沙特国王大学学报6这篇调查文章的组织如下：通过社交媒体的各种类型的信息在第1.1节中进行了分类，假新闻在几个学科中传播的概念在第1.2节中，定量检测社交媒体上的假新闻的至关重要性，快速，准确在第1.3节，并考虑我们的研究的根本原因和重要性在第1.4节。第二部分重点介绍了网络假新闻的特征及其构成要素，包括网络假新闻的制造者和受众、新闻的内容以及网络假新闻的社会背景。在第3节和第4节中，我们通过四个方向来解决假新闻识别问题：语言学，语义分析;基于知识的方法，检查新闻内容（文本）中包含的知识是否与现实（实际知识）兼容;以及基于风格的方法，专注于虚假信息的写作风格（例如，如果它是用强烈的感情表达的）。第5节是识别互联网上虚假新闻的最循证分析，并强调了误导性新闻陈述的关键属性。第6节提供了最新的基于研究的研究，用于检测和分析社交媒体上的假新闻，以及链接到在线资源进行事实核查和一些实用的社会准则。此外，机器学习和深度学习也被建议用于检测假新闻。第7节分析了可用于假新闻检测的假新闻数据集。第8节描述了基于不同特征和属性的假新闻与现有调查的比较分析。第9节讨论了在线假新闻分析的各种可能的研究方向。最后，我们在第10节中总结了我们的文章，包括一些未来的范围。2. 假新闻目前，互联网上的假新闻在主题、方法和渠道方面广泛传播并不断扩大（Sansonetti等人， 2020年）。也很难提出一个普遍认同的根据斯坦福大学的说法作者（Genes，2017）提到，根据维基百科，假新闻的定义是此外，越来越多的虚假文章正在通过社交媒体传播在这篇研究文章中，我们对“假新闻”一词的理解通过解决各种在线不准确的信息，而不失去特异性，客户评论和欺诈性促销，我们在这篇研究文章中解决并提供了。2.1. 假新闻假新闻是通过新闻内容传播的，可以分为实物和非实物两大类。在图5中，我们说明了新闻内容的类型及其特征。实体新闻内容：作者（Zhang和Xichen，2020）描述了社交网络越来越受欢迎，见图4。假新闻的属性、特征和检测方法。●M.R. Kondamudi，S.R.萨胡湖Chouhan等人沙特国王大学学报7图五. 假新闻的特征决定了新闻内容的不同类型。诸如社交媒体平台上的帖子之类的在线社交数据已经取代了用于传输数据的重要网络考虑到新闻报道的限制，在线社交媒体平台的内容在线社交通信是流行新兴话题的有效指标，因为它们发生了（Rauchfleisch等人， 2020年）。在这种情况下，信息的物理内容包括数字通信材料中包含的例如，网站的URL、关键字、参考符号、表情、图片和多媒体。这些元素对于识别假新闻至关重要，因为它们具有特定的定义和功能。非物质新闻内容：作者（张曦晨，2020）提到，物质元素似乎是信息的载体和结构，而非物质元素是新闻人物的思想，感情，性格和情绪。根据我们的定义，假新闻可以分为各种类别，如欺诈性评论，虚假宣传，误导性政治新闻等等。每天有成千上万的评论写在电子商务网站上，如eBay，亚马逊等。评论的质量和歧视是互联网消费者和企业面临的主要挑战决策不仅受到虚假评论的影响，而且还会损害企业的商誉。假冒广告，如虚假评论，是故意通过不正确和未经测试的数据进行品牌推广来欺骗买家。欺诈性评论和虚假促销都对在线购物网站的声誉构成威胁假新闻扮演了非常重要的角色。由于虚假信息的广泛传播，误导了用户。政治信息已成为当今每个人的主要关注点假新闻的基本组成部分是非物质内容，包括作者希望传达给受众的所有重要原则、情感和观点情感极化是非物质内容用于信息的另一个重要方面作者经常在文章正文中表达积极或消极的感觉，以提高他们的可信度（Jour等人， 2022年）。2.2. 假新闻社会语境是指新闻传播的整个社会环境和活动系统.这涉及到社会信息的共享方式，以及个体之间如何互动。如今，社交网站上的新通信技术正逐渐主导通信和传达知识的方法（Olteanu等人， 2018年）。此外，互联网社区的社会背景可能为区分成功提供有用的信息从绝大多数的通信中获取完整的社交内容。依靠媒体网站，新闻现在通过电视、广播和报纸等传统传播方式传播和传播。以及社交网站，如Facebook，Twitter，Instagram等。社交媒体平台正在改变人们接收信息和更新的方式。在线活跃用户不仅可以阅读时事，还可以交流个人经历，争取问题和话题。在线社交网络用户，包括朋友到追随者，交流他们的经验和与特定人群的关系。沟通的影响力可能会增强如果几个志同道合的个人发帖、发推或发送;这被称为“重复泡沫现象”。这种影响可能有助于传播虚假信息，因为网站访问者可能更好地与社交社区联系（Sansonetti等人，2020年）。假新闻的另一个重要特征是社会背景，它影响着传播模式，包括真实和不真实的新闻。在图6中，我们提供了社会背景类别及其特征的示例。2.3. 假新闻的创造者及其意图作者（Zhang和Xichen，2020）提到，解释谁对假新闻负责以及发布假新闻的原因至关重要。机器人和真正的用户很容易创建和传播不准确的信息。在图7中，我们说明了新闻的创造者/传播者的类型及其特征。真实用户：真实世界中的人是假新闻传播的主要贡献者。在线新闻读者和在线活跃用户主要是在线社交网络上虚假信息的传播者。一些网络账户持有人是由个人建立的，以新闻的形式传播错误信息。无论假新闻是单独传播还是机械传播，想要破坏社交媒体平台合法性的实际人员都是难以解决的错误信息的主要来源。因为欺诈性文章是由有害网站访问者创建的。仅仅使用语言和内容评估来区分虚假和真实的新闻是极其具有挑战性的（Sansonetti等人，2020年）。一些无害的在线活跃用户正在社交媒体上传播假新闻。例如，下面的声明是完全错误的：“一名涉嫌参与希拉里被盗电子邮件的联邦调查局特工被发现死于涉嫌犯罪”。此外，Facebook用户已经分享了近50万次相同的新闻（Genes，2017）。许多经常上网的人都变成了误传者。也许即将到来的假新闻骗子是见图6。不同类型的假新闻基于其社会语境特点。●●M.R. Kondamudi，S.R.萨胡湖Chouhan等人沙特国王大学学报8如图6所示，假政治新闻和名人新闻被用来欺骗人们，使他们认为他们正在阅读准确的假新闻制造商像其他正常的在线用户或机器人一样使用社交媒体平台。例如恶意软件、垃圾邮件、勒索软件以及图7中所示的更多方式。我们将在接下来的章节中更深入地探讨基于新闻内容的假新闻检测。3. 基于新闻内容的假新闻见图7。不同类型的假新闻创造者根据他们的特点。与我们的朋友和追随者的真正活跃的个人身份是目前可见的互联网上。结果，就形成了一个回音室，广泛传播假新闻。由于在线社交网络的隐私性，在线用户不需要对他们分享、交换和讨论的内容负责。这是极其危险的，因为假新闻有可能像病毒一样传播，并严重影响在线社交网络。机器人：最普遍的非人类虚假新闻制造者是网络聊天机器人和复制者。恶意节点是计算机化的程序，它们被编程为通过浏览开发内容并与人交互来表现得像社交网站上的人类。即使一些恶意节点在可信信息的传播中起着关键作用。许多机器人被明确设计用于传播谣言、恶意软件、垃圾邮件、勒索软件、虚假信息、八卦或简单的混乱（Ferrara等人， 2016年）。例如，在2016年美国大选中，数百万社交机器人被生成以支持特朗普和克林顿，向假新闻网站发送无数推文（Shu等人，2017年b）。半机械人似乎要么是真人聊天机器人，要么是有感知的自动化工具（Zhuang等人，2023年）。半机械人档案可以发送信息，并与支持网络互动后，成为授权的人。有害的电子人配置文件，如社交机器人，通过传播可能损害社会信任和信心的虚假消息和信息来欺骗和操纵在线社交观众。由于机器人的行为，半机器人已经演变成一个快速和容易传播假新闻的重要媒介。假新闻的目标受众可能会因误导性内容的目的而异。政治家和普通人可能是虚假政治声明的预期接受者。社交网络用户可能是虚假评论和广告的预期接收者，而家庭可能是虚假教育信息的预期接收者。老年人可能是虚假医疗信息的目标受众。例如，在加拿大，一名11岁的女孩声称，一名男子试图用剪刀取下她的头巾。2.4.章节摘要有几种方法可以传播假新闻。其中一些依赖于新闻报道的内容。如网站网址，关键字，图像，多媒体，以及更多的演示图。五、通过阅读社交媒体帖子作为社交背景和影响，原始新闻的物理内容，如标题，正文，照片和视频，可以用来发现假新闻，以及收集最不公平和歧视性的行为。对新闻材料的深入分析使我们能够评估涵盖真新闻和假新闻的语法结构。基于新闻内容的假新闻通过各种分析进行分类，例如基于语言和语义的分析，基于知识的分析和基于风格的分析。3.1. 语言和语义分析使用语言学和语义学参数对语音模式进行评估是传统的和实验性的。这种评估可以通过从文本中提取有价值的知识来研究新闻的相关语言形式，模式和不同的基于语言学和语义的分析是：基于专家的分析：假新闻是为了在经济、政治和其他领域获得优势而制作的。研究的主要目标是通过语法结构的研究和写作模式的识别来提高新闻撰稿人的语言技能（Seo等人， 2021年）。大多数假新闻作者使用特定的写作风格来自动发现（Conroy等人，2015年）。作者（Barve et al.， 2022）提到，通过使用“词袋”和“n元语法”来检测医疗保健错误信息是用于传达新闻故事的常见和流行的方法（Tai等人，2020年）。新闻的基本内容可以表述为一个“词袋”的集合，把每一个词作为一个独立的等价组，完全忽略包括构词法在内的此外，“n元语法”由n个此外，这些不同目标的灵活性对于基本信息提取具有一些明显的缺点。例如，“n-gram”方法具有严重的特征空间，并且不能理解包含未识别词的由于忽略了单词的背景和语义最近，高级语法研究的想法被提出用于文本分类和语言保护（Seddari等人， 2022年）。作者（Goldberg和Levy，2014）描述了单词2vec。作者在（Liu et al.， 2021年）。基于序列2序列的深度基于语义的分析：基于语义的研究是对内容的句法规则从词的层次分析到可理解层次的发展。这可以通过将“n-gram”模型与更深层次的语法模型相结合来建立一定程度的一致性。作者独特的视角，以及新闻的真实性（康罗伊等人， 2015年）。例如，为了吸引观众的注意力，假新闻经常使用夸大的因此，虚假新闻的标题一般与新闻内容无关或矛盾。●●●M.R. Kondamudi，S.R.萨胡湖Chouhan等人沙特国王大学学报9另一方面，一个实际的新闻文章评论者不知道新闻内容的功能和特点，因此虚假的互联网评价可能包含不一致和不准确的判断。因此，基于语义的分析可以为评估网络内容的可疑质量提供重要的线索。调查人员可以通过文章制造商评估和基于语义的分析，使用整合后的数据来评估一个人的历史和新闻内容之间的兼容性。这表明在误导性信息的识别和分类方面取得了重大进展。3.2. 知识分析作者（Seddari等人，2022）描述了应用基于知识和基于语言的特征以具有良好的准确性。在基于知识的调查中，讨论了独立评估重要新闻报道的真实性的进展（Shu et al.，2017 a; Salaberria等人，2023年）。事实核查是一个过程，经常用来区分虚假的亲异教徒从知识为基础的方法。事实核查起源于新闻报道，旨在通过对比来自尚未核实的新闻内容的数据来评估新闻的可信度。之前讨论过的事实核查网站，如PolitiFact.com，FactCheck.org和Snopes.com，是利用其知识识别虚假新闻的网站的经典例子。在图8中，我们展示了假新闻的知识型新闻创造者以及假新闻如何在社交网络上传播。基于此，事实核查网站正在检查新闻是真是假。在这些网站上可以找到公共和技术工具。我们在第3.2.1和3.2.2节中讨论了手动和自动事实核查过程。3.2.1. 人工事实核查人工事实核查大致可分为三类。例如基于专家的人工事实核查、基于专家的事实核查网站和众包人工事实核查。见图8。知识型假新闻及其特征。基于专家的手动事实核查：它通常由一组非常可靠的事实核查人员使用，使用简单，并提供真实的结果。它的成本很高，并且不能随着待评估材料的体积的扩大而有效地扩大。基于专家的事实核查网站：第6.1节描述了基于专家的事实核查网站。此外，作者（Zhang等人， 2018年）提到，为了帮助公众，网上出现了各种网站，提供基于专业意见的事实核查。PolitiFact评分系统显示与特定主题相关的所有声明的真实性这些信息可以证明文章的真实性，并有助于识别需要更多检查才能确认的问题另一个例子是Hoax-Slayer。它与大多数事实核查系统的不同之处在于，它将文档和通信分为欺诈、垃圾和误导性信息等类别，而不是集中在数据的可靠性上。虽然该网站包含了对这些群体的详细解释，但其数据可以作为分析虚假新闻的基础。杜克大学的记者实验室提供了一个进行事实核查的网站的综合列表。作者（Reporterslab，2022）提到，来自不同国家和语言的200多个事实核查网站被突出显示。一般来说，由专家运营的事实核查网站可以提供上下文信息来识别假新闻。PolitiFact和Gos- sipCop网站帮助创建了误导公众的新闻数据库例如，在（Dong等人， 2020），也是在（Shu et al.，2020年，还有更多。这些资源对批准的内容进行了深入的、基于专家的检查，并为检测虚假新闻的例如识别对检查感兴趣的信息和伪造新闻的可理解识别（Saleh等人， 2021年）。众包人工事实核查：一般来说，众包涉及将一个巨大的任务分解为许多较小的任务，以便许多人可以独立地工作作为事实核查者的常规用户是众包手动事实核查的基础。利用各种基本的众包技术，可以让大量的事实核查人员参与进来。一个由帖子、主题、事件和相关的人类可信度评估组成的语料库试图为CREDBANK进行补偿。它立即确定，在全球帖子流中，大约有24%的事件被视为真实的。 CREDBANK 是一个数据集，它依赖于 AmazonMechanical Turk等平台（Mitra和Gilbert，2015）。公众可以访问已经创建的相当大的虚假新闻数据集。由于事实核查人员的意见很大，反应很规律，众包事实核查似乎比基于专家的事实核查更难分析，这降低了它们的准确性和可靠性。因此，在众包事实核查中，通常需要过滤掉不可靠的来源，以证明不同的结果是正确的。随着事实核查人员数量的增加，这些约束变得格外重要但是，事实核查人员经常能够提供更有意义的评论，因为网站使用众包。对假新闻的调查可以进一步探索。3.2.2. 自动事实核查最近创建的内容数量无法通过人工事实检查来处理，特别是在社交媒体平台上。已经创建了自动事实检查方法来解决可持续性问题，这在很大程度上取决于机器学习技术，信息检索和自然语言●●●M.R. Kondamudi，S.R.萨胡湖Chouhan等人沙特国王大学学报10jjjj处理，以及网络/图形理论来评估各种方法。现有的信息给出了第一个统一的、标准的知识表示，这些知识可以被计算机预处理，并经常应用于相关研究（Nickel等人，2015年）。数据由基于数据的主语（Y）、谓语（Z）和宾语（I）值的混合准确表示。以“唐纳德·特朗普是美国总统”掌握的信息为例。我们提供了广泛接受的关键概念的解释，这些概念通常出现在技术事实检查中，利用先前已知的信息来更好地理解（Wang等人，2022年a）。真理的来源是知识基础，它将真理定义为已被证实为真的知识（YZI三元组）（Zhou和Zafarani，2020）。此外，知识图是一种网络结构，它解释了为什么YZI的知识库增加了两倍。在YZI三元组中，顶点代表单位（即，对象或主体），并且边缘表示接触（即，YZI三元组中的谓词）。事实提取和事实核查是事实

下载后可阅读完整内容，剩余1页未读，立即下载

cpongm

粉丝: 5
资源: 2万+

社交网络中假新闻的调查与检测方法

最新资源