道德情感塑造COVID-19错误信息的病毒性传播在社交媒体上的影响性

80 浏览量更新于2023-11-29 收藏 814KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

3706→道德情绪塑造了社交媒体上COVID-19错误信息的病毒性摘要KirillSolovevkirill.solovev@wi.jlug.deJLU吉森德国NicolasPröllochsnicolas.proellochs@wi.jlug.deJLU Giessen德国为社会的大部分人提供健康信息[39]。另虽然虚假谣言对成功战胜COVID-19大流行构成威胁，但对谣言如何在在线社交网络中传播的理解-即使是在非危机情况下-仍处于起步阶段。在这里，我们分析了一个由来自Twitter的COVID-19谣言级联组成的大样本，这些谣言已经过第三方组织的事实核查。该数据包括N= 10，610个谣言级联，已被转发超过2400万次。我们调查了COVID-19错误信息是否比真相传播得更快，以及真实与真实信息传播的差异是否存在虚假的谣言可以用它所承载的道德情感来解释。我们观察到，平均而言，COVID-19错误信息比真实信息更容易传播。然而，真实性效应受到道德情感的调节：如果源推文嵌入大量谴责他人的情感词，则虚假谣言比真相更具病毒性，而更多的自我意识情感词则与较少的病毒性传播有关这种影响对于健康错误信息和虚假政治谣言都很明显。这些发现提供了关于真实与虚假谣言如何传播的见解，并强调了在社交媒体内容中考虑道德情感家族情绪的重要性。CCS概念• 以人为中心的计算社会媒体;协作和社会计算的实证研究;·应用计算→社会学。关键词社交媒体，错误信息，COVID-19，病毒式传播，道德情感，计算社会科学，解释性建模ACM参考格式：基里尔·索洛夫和尼古拉斯·普罗洛克斯2022年道德情绪塑造了社交媒体上COVID-19错误信息的病毒性。在ACMWeb Conference 2022（WWW'22）的会议记录中，2022年4月25日至29日，虚拟活动，法国里昂。ACM，纽约州纽约市，美国， 12 页。 https://doi.org/10.1145/3485447 。35122661引言社交媒体平台在COVID- 19大流行期间扮演着矛盾的角色一方面，它们代表了允许制作部分或全部本作品的数字或硬拷贝供个人或课堂使用，无需付费，前提是复制品不以营利或商业利益为目的制作或分发，并且复制品在第一页上带有此通知和完整的引用。必须尊重本作品第三方组件的版权对于所有其他用途，请联系所有者/作者。WWW©2022版权归所有者/作者所有。ACM ISBN978-1-4503-9096-5/22/04。https://doi.org/10.1145/3485447.3512266一方面，然而，这场危机已经滋生了大量的谣言[24，26，33，36，45]，和有信誉的事实核查组织的判决（e。例如，在一个实施例中，politifact.com ，snopes.com ）表明社交媒体充斥着COVID-19的错误信息。社交媒体上的COVID-19错误信息包括但不限于关于疫苗接种、“奇迹疗法”和所谓的预防措施的错误信息[32]。虚假谣言会影响公共卫生建议的及时有效采纳[66]，影响政府采取的应对措施的有效性[50]，有时甚至被用作政治武器[51]。鉴于接触错误信息经常表现为离线后果[45]，因此迫切需要研究在COVID-19背景下社交媒体上的谣言传播世卫组织总干事谭德塞（Tedros Adhanom Ghebreyesus）和其他专家谈到了必须与之斗争的“信息流行病”。虽然以前的研究-至少在非危机情况下-表明社交媒体上的虚假谣言往往比真相更具病毒性[48，65]，但其病毒传播的机制尽管至关重要，但仍未得到解决。在这项工作中，我们通过道德和情感的镜头以及它们在两极分化的社交媒体环境中的谣言传播中的作用来探讨这个问题。社交媒体内容不仅传递事实信息，还传递道德观念和复杂的情感信号[8]。道德情感为人类做好事和避免做坏事提供了动力[59]，甚至可以用来“道德化”否则会被认为是非道德的行为[ 68 ]。由于社交连接的用户通常会产生类似的想法和直觉[8，13，23，39]，道德情感是两极分化的社交媒体环境中信息扩散的关键驱动力[8]。在COVID-19的背景下，整体讨论文化一再被描述为高度两极分化[1，17，21，31，32，34]。例如，人们在对政府反应的看法、对科学家的信心以及对保护行动的支持方面存在分歧[31，34]。如果COVID-19谣言在社交媒体用户中高度两极分化，那么道德情感的传播可能在谣言通过社交网络传播中起着关键作用主要的道德情感可以分为两大类[30]。这些家庭是“谴责他人”的家庭，包括蔑视，愤怒和厌恶的情绪，以及“自我意识”的家庭，包括羞耻，骄傲和内疚的情绪。前者是谴责他人的情绪，是对他人社会行为的反应，涉及对他人的负面判断或不赞成。在道德的背景下，谴责他人的情绪有时也被称为其他谴责情绪通常与感知到的道德违规有关，例如，在个人权利和公平的背景下[ 62 ]。而个体情感在其他谴责家庭（i。例如，愤怒、蔑视和厌恶）通常被认为是3707WWW虽然它们本身不是特别具有爆炸性，但当它们被压缩在一起时，它们可能成为危险的爆炸性混合物[52]。它们的对应物是自我意识情感家族，由自我反思和自我评价唤起。这些情绪激励个体以社会可接受的方式行事，并与同情和利他主义等亲社会行为有关[30，52]。因此，自我意识的情绪可以使社会愈合，避免引发他人的蔑视，愤怒和厌恶。虽然之前的研究[8]广泛区分了社交媒体内容中的道德与非道德情绪，但我们将研究这两种道德情绪（自我意识与他人谴责情绪）是否对COVID-19背景下的谣言传播有不同的影响。研究假设：在这项工作中，我们提出，真实与真实的虚拟性虚假的COVID-19谣言可以用它们所携带的道德情感来解释。虽然之前的研究表明，虚假谣言在统计上更经常被转发[48，65]，但并不是每个虚假谣言都比真实的谣言更具病毒性相反，病毒式传播的错误信息经常通过回音室传播，加剧了意识形态的两极分化[12]。在这些环境中，意识形态身份在引导用户行为方面更加突出[67]，用户被推向更极端的位置[14]。极化不仅减少了验证行为[35，41]，而且使用户更容易接受对他人的敌意，例如。例如，在一个实施例中，政治攻击[61]。在这里，来源推文中嵌入的其他谴责情绪，开始了谣言级联，可能起到加速器和放大器的作用[63]。在关于COVID-19的两极分化讨论中，这意味着激进的想法和信念得到加强，更有可能转化为行动。鉴于虚假谣言的意识形态两极分化日益加剧[20]，谴责他人的情绪的爆炸性混合应该会加速它们在社交网络中的传播同样的推理表明，嵌入自我意识情绪的虚假谣言（避免引发他人谴责情绪[30]）在社交媒体上的传染性应该较小。总而言之，我们假设，在源推文中具有更强的虚假内容和谴责他人的情绪组合的谣言会到达更多的人，而虚假内容和自我意识情绪的组合会到达更少的人。数据：我们收集了2020年1月至2021年4月底期间在Twitter上传播的COVID-19谣言案例的独特数据集。每个谣言级联都由三个独立的事实核查组织（snopes.com，politifact.com，truthorfiction.com）中的至少一个进行调查和我们的数据包括10610条谣言级联，被转发了2434万次。方法：我们使用文本分析来提取嵌入在谣言级联中的细粒度道德情感（自我意识和他人谴责）。具体来说，我们采用（和验证）基于字典的方法来计算出现的频率的自我意识和其他谴责情绪的话，在源推文发起的谣言级联。为了测量每个谣言级联的扩散，我们使用Twitter历史API来获得转发的数量，即与谣言级联交互的用户数量。然后，我们拟合解释性回归模型，以评估道德情绪的变化如何与真实与真实的转发数量的差异相关。假Ru-mor级联。在我们的回归分析中，我们遵循以前的工作[8，65]通过控制已知影响转推率的变量，独立于主要预测因素，即。例如，关注者的数量、账户年龄等。研究结果：我们观察到，平均而言，COVID-19错误信息比真实信息更容易传播。然而，真实性效应受到道德情感的调节：如果源推文嵌入大量谴责他人的情感词，则虚假谣言比真相更具病毒性，而更多的自我意识情感词则与较少的病毒性传播有关。这种影响对于健康错误信息和虚假政治谣言都很明显。这些发现提供了关于真实与虚假谣言如何传播的见解，并强调了在社交媒体内容中考虑道德情感家族情绪的重要性。2背景2.1社交媒体上的错误信息社交媒体已经将内容的质量控制从训练有素的记者转移到普通用户[35]。缺乏专家的监督使社交媒体容易受到错误信息的传播[53]。社交媒体确实一再被观察到是一种传播大量错误信息的媒介。例如，在一个实施例中，47、65]。社交媒体上错误信息的存在也对离线世界中意见的形成产生了不利影响[2，4，19，42]。因此，它不仅威胁到个人和组织的声誉，而且威胁到整个社会有几部作品关注的是为什么错误信息在社交媒体上广泛传播的问题这些研究表明，用户很难发现错误信息，因为这些信息往往是故意误导他人的[69]。此外，社交媒体用户通常处于享乐主义心态，避免认知推理，如验证行为[41]。绝大多数社交媒体用户不会对他们阅读的文章进行事实核查[27，64]。最近的一项研究进一步表明，目前的平台设计可能会阻碍用户对准确性的反思[44]。在线社交网络也具有（政治）极化[38，47，55]和回音室[5]的特征在这些低内容多样性和强社会强化的信息环境中，用户倾向于选择性地消费具有相似观点或意识形态的信息，而忽略相互矛盾的论点[22]。这些影响甚至可以在重复暴露的情况下被夸大：一旦错误信息被吸收，即使错误信息被揭穿，用户也不太可能改变他们的信念[43]。2.2谣言传播研究一些研究分析了社交媒体上谣言与非谣言的传播动态。这包括分析有关的摘要统计，例如，转推的数量[e]。例如，在一个实施例中，[25]《易经》云：“君子之道，焉可诬也？”例如，在一个实施例中，7、10、19]。然而，这些作品辨别级联从谣言与。非谣言，不关注真实性的差异另一种文学流分析了关于特定事件的谣言（e。例如，在一个实施例中，2013年波士顿马拉松爆炸案）关于整体推文数量或内容[e. 例如，在一个实施例中，18、56、57]。这些作品分析了用户群对谣言的反应，但同样没有分析真假谣言的传播动态。3708道德情绪塑造COVID-19社交媒体上的错误信息WWW只有少数作品分析了真实与真实传播的差异虚假的谣言Friggeri等人2014年[25]，他对《表1：用于识别来自事实核查组织的COVID-19相关事实核查的标签根据事实核查评估来自snopes.com.作者发现，大多数虚假谣言的再分享这表明社交媒体用户可能没有注意到事实核查;或者故意忽略他们的裁决。与我们的工作最接近的是Vosoughi等人的研究（2018年）[65]，提供了真实与Twitter上的虚假谣言，发现虚假谣言比真相传播得更远，更快，更广泛然而，这项工作并没有分析真正的传播与在COVID-19背景下的虚假谣言同样的数据集[65]也被用于最近的一项研究[48]，该研究测量了谣言级联回复中嵌入的情绪。作者发现，某些情绪的高频率（例如，例如，在一个实施例中，愤怒）与虚假谣言的更多病毒级联有关。在COVID-19的背景下，对真实和虚假谣言传播进行大规模定量分析的研究很少。现有的工作主要集中在对少量手工标记的谣言或基于来源的方法进行汇总统计，以识别COVID-19错误信息。例如，在一个实施例中，15、36、54]。例如，Cinelli et al.（2020）将新闻来源分为可靠及不可靠来源，以分析COVID-19相关内容的传播。作者发现，在传播动力学方面没有显着差异。然而，值得注意的是，可靠与不可靠的来源不一定对应于真实的谣言与虚假的谣言。此外，基于来源的方法忽略了来自有影响力的个人、新兴网站的虚假谣言，并且错误地分类来自通常被认为是可靠的网站的虚假谣言请注意，最近有其他论文报告称，社交媒体上广泛存在COVID-19错误信息，描述了COVID-19错误信息，并表达了对公共卫生后果的担忧[e. 例如，在一个实施例中，26、28、33、36、45]。然而，这些工作并没有集中在模拟真实与真实的扩散差异。虚假的COVID-19谣言级联。我们的贡献：这项工作有两个关键贡献。(1) 我们收集了一个独特的COVID-19谣言级联数据集，并证明错误信息平均比真相更具病毒性。在这里，我们的研究与以前的工作[48 ，65] 相联系，这些工作得出了类似的结论，但不是在COVID-19的背景（2）虚假谣言的病毒传播机制虽然至关重要，但在以前的研究中基本上没有得到解决。我们的工作是第一个通过道德和情感的镜头来处理这个问题的工作-发现嵌入在源推文中的道德情感塑造了社交媒体上虚假谣言的传播。3方法3.1数据收集事实核查：我们确定了三个事实核查组织，彻底调查与COVID-19相关的谣言。事实核查组织的名称是：politifact.com，truthorfiction。com和snopes.com。这些事实核查组织将COVID-19谣言列为单独的类别，或用主题标签（例如：例如，在一个实施例中，“COVID-19”,“Coronavirus”) which allows us todistinguish COVID- ①的人。我们从这些平台上抓取了所有与COVID-19相关的事实核查。事实核查组织标签#事实核查politifact.org冠状病毒403snopes.comCOVID-19 265truthorfiction.comcovid-19 44事实核查组织有不同的方式来标记谣言的真实性例如，politifact.com的文章被给予snopes.com“PantsonFire”的虚假谣言评级，而www.example.com则分配了“false”标签。与Vosoughi et al.[65]，我们通过将不同站点的准确性标签映射到1到5的分数来对它们进行归一化。所有得分为1或2的谣言都被归类为“假”，而得分为4或5的谣言则被归类为“真”。3分的谣言被归类为“混合”。在某些情况下，同一谣言已被多个事实核查机构调查。先前的研究表明，事实核查网站显示出很高的成对一致性[65]，范围在95%到98%之间。被归类为“真”或“假”的谣言甚至显示出100%的完美成对一致性[ 65 ]。事实核查的结果汇编包含以下信息：(i) 真实性标签（Twitter上的谣言级联：我们遵循了Vosoughi等人的方法。（2018）识别Twitter上的谣言级联：Twitter上的谣言级联始于用户对某个主题做出断言，例如发送短信或文章链接。社交媒体用户通过转发来传播谣言。通常，人们也会回复原始推文。这些回复有时包含指向事实核查组织的链接，这些组织要么证实要么揭穿原始推文中的谣言。我们使用这种级联来识别在Twitter上传播的谣言级联。我们使用Twitter Historical API将谣言映射到Twitter上的转发级联，如下所示。首先，我们收集了所有包含事实核查组织网站链接的推文。其次，对于每条回复推文，我们提取了原始推文和原始推文的转发次数。在这里，需要特别注意确保回复包含指向任何可信网站的链接，以解决原始推文。我们遵循Vosoughi等人的方法[65]为了解决这一重要问题：（i）我们只考虑了对原始推文的回复，排除了对回复的回复。（ii）为了确保我们研究未经核实和有争议的信息如何在Twitter上传播，我们删除了所有直接链接到事实核查网站的原始推文请注意，链接到事实核查网站之一的推文不符合资格，因为它们不再未经验证。（iii）我们将链接文章的标题与原始推文的标题进行了比较。为此，我们使用Universal Sentence Encoder [11]将事实检查的标题和原始推文转换为捕捉其语义内容的矢量表示然后，我们使用余弦相似性来测量向量之间的距离。如果余弦相似度低于0.4，则该推文被丢弃。在这些过滤步骤之后剩余的转发级联则表示在Twitter上传播的谣言3709[客户端]WWW表2：谣言发起者推文的汇总统计平均值以粗体突出显示，标准差显示在括号中。所有Twitter变量都是从Twitter历史API中获取的。可变所有级联PolI TI CS健康其他收集日期2019 -2019 -20192019级联数10,6108,1574,1161,297转发次数24,339,62520,374,09710,231,3821,416,474转推计数范围0000比例百分之三十五点三39.0%百分之三十四点七百分之十九点七比例错误46.9%42.7%48.3%百分之六十四点八混合比例百分之十七点七百分之十八点三17.0%百分之十五点六追随者2，256，095（7，700，566）2，545，874（8，260，175）2，526，538（9，166，450）816，527.4（3，859，619）关注者9，193.9（34，750.39）10 124.4（37507.33）9 320.23（40249.53）5 952.10（25 541.03）账龄3，333.35（1，383.38）3，374.93（1，376.82）3，321.95（1，391.67）3，098.33（1，386.78）查实的用户百分之五十五点一百分之六十点二百分之五十六31.9%包括媒体百分之二十八点六百分之二十七百分之二十六点四百分之三十八点二谴责情绪0.167（0.217）0.164（0.201）0.153（0.190）0.189（0.291）自我意识情绪0.300（0.209）0.294（0.198）0.317（0.196）0.321（0.256）根据事实核查组织的评估，标签是已知的。在我们的数据中，事实核查标签在级联水平上的频率是：3，748（=真），4，979（=假）和1，883（=混合）。这10，610条谣言已经被Twitter用户转发了2433万次。在之前的工作[8，65]之后，我们使用Twitter API为每个源tweet收集一组额外的用户变量i. 例如，关注者的数量、账户年龄等。已知这些变量会影响转发率，并在我们的回归模型中用作控制变量。我们的数据集的汇总统计报告在表1中。二、3.2情绪评分的计算道德情感的我们采用文本挖掘方法来衡量这些情绪在源推文中嵌入的程度。为此，我们首先应用文本挖掘的标准预处理步骤。具体来说，运行的文本被转换为小写和标记化，以及特殊字符（例如。例如，在一个实施例中，标签、表情符号）被删除。随后，我们应用（并验证）了类似于早期研究的基于字典的方法[8，48，65]。我们根据NRC情绪词典[40]测量了源推文中嵌入的谴责他人和自我意识的情绪。该词典包括181，820个英语单词，这些单词根据Plutchik的情感模型[ 46 ]的情感进行分类。Plutchik 情感二分体代表了复杂的情感，它是由两种基本情感的组合而产生的[49]。我们使用NRC字典来计算属于每种情绪的推文中的单词的频率然后，我们将单词计数除以文本中的字典单词总数，该向量被归一化为跨情绪求和为1 [48，65]。在我们的数据中，78.15%的源推文包含至少一个来自NRC词典的情感词我们过滤掉不包含任何情感词的推文，因为否则，分母没有定义[48，65]。然而，我们后来的分析产生了定性相同的结果时，包括这些观察（即。例如，分配零值）。根据8种基本情绪和24种衍生情绪的得分，以及两种道德情绪家族的定义[ 60 ]，我们通过计算愤怒、厌恶和蔑视的总和来计算谴责他人的情绪。自我意识的情绪是通过计算羞耻、骄傲和内疚的总和来计算的。用户研究：为了测试我们基于词典的方法的结构有效性，我们聘请了两名训练有素的研究助理来注释200条推文的随机子集，这些推文根据词典被归类为比自我意识更谴责他人;以及200条推文的随机子集被归类为比他人谴责更自我意识。对于400条推文中的每一条，注释者都被问及推文在两个5分制的李克特量表上与他人谴责和自我意识情绪的相关程度，范围从1（“与[他人谴责，自我意识]情绪完全无关”）到5（“与[他人谴责，自我意识]情绪非常相关”）。注释器以随机顺序观看推文，并解释了谴责他人和自我意识情绪之间的区别。根据Kendall's W（p 0 . 05），注释者表现出统计学显著的评分者间一致性<。01）。此外，注释者将谴责他人的推文的随机子集评定为“谴责他人”多于“自我意识”t = 6。53，p <0. 001;自我意识推文的随机子集比“其他谴责”更“自我意识”[ t = 4. 50，p <0。001]。3710−道德情绪塑造COVID-19社交媒体上的错误信息WWW表3：每个主题的谣言发起者的示例性推文。主题准确性Twitter消息PolI tI csPolItI cs特朗普真的在2018年解雇了大流行病应对团队。他没有取代他们...#TrumpYoureKilling假生病：南希佩洛西试图将堕胎资金措施插入中国冠状病毒应对刺激计划中，我再也不想听到唐纳德特朗普再次将这一流行病政治化，而民主党人则尝试这种特技。今年死于新冠肺炎的警察人数超过了在巡逻中丧生的警察人数。枪击是第二大死亡原因80%的人服用Maderna疫苗有明显的副作用。当杀手比尔盖茨一路笑着去银行的时候。停止这种疯狂！这是佐治亚州波尔丁县开学的第一天其他错误我认为这应该是一个阴谋论。但这是特鲁多亲口说大流行病是由联合国领导的世界“大重置”的借口。3.3谣言话题我们采用了弱监督机器学习框架，[70]以推断源推文中引发谣言级联的主题。这种最先进的方法的好处是，(i)它被认为优于传统的主题建模（即，例如，潜在狄利克雷分配）用于短文本[70]，以及（ii）其弱监督性质允许事先选择我们认为在COVID背景下特别相关的主题19. 我们将谣言级联分为三个（不相互排斥的）主题：健康（e。例如，在一个实施例中，关于疫苗安全性的谣言），Politics（例如，例如，在一个实施例中，政治反对派的指控），以及其他（i.例如，不属于其他类别的谣言Tbl中提供了每个主题的示例tweet3.我们的弱监督机器学习框架分为三个步骤（见Yao et al. [70]方法细节）：（1）我们开始根据每个主题的一组手动选择的关键字来识别与主题相关的推文例如，对于健康主题，我们搜索所有包含“疫苗”，“流感”，“口罩”等词的推文。（参见补充材料中的关键词列表(1) 我们对关键词识别的推文进行了聚类辅助手动词义消歧[70]。在这里，我们使用k-均值聚类算法与剪影标准聚类的关键字识别的推文为每个主题。然后，我们手动检查从每个集群中抽样的随机推文，并评估集群中的推文是否涉及主题。我们排除了每个没有显示主题关键字相关含义的tweet clus- ter这使我们能够显著清理和提高关键字识别推文的质量（3）我们使用创建的标记数据来训练深度神经网络分类器，并学习预测单个Twitter消息是否属于某个主题。用于训练机器学习分类器的输入数据是（清理的）关键字识别的推文和主题标签的向量表示。为了创建推文的向量表示，我们使用了通用句子编码器形式的神经语言模型[11]。在我们的深度神经网络分类器中，我们将预测推文（的向量表示）的主题标签的任务视为多标签问题，考虑到一条推文可能属于多个主题（即。例如，健康和政策）。在训练中，我们为每个主题使用了相同数量的1000个关键词识别的推文作为积极的训练实例。此外，我们使用步骤（2）中排除的推文和随机抽样的未标记推文，对于作为负训练实例的标记推文的总和，i.例如，带有一个主题标签Other。用户研究：为了确保主题预测的准确性，我们在两名训练有素的研究助理的帮助下测试了错误推文的存在。我们为每个主题随机抽取了200条推文，并指示研究助理对推文进行注释。每个注释者被要求在5分制的李克特量表上判断主题标签的有效性，范围从1（“与[主题]完全无关”）到5（“与[主题]非常相关”）。当将人类注释与预测的主题标签进行比较时，我们发现很少有错误分类的实例。平均而言，未被归类为“至少与[主题]有点相关”的推文的比例低于8。5%（见补充材料）。3.4模型规格我们指定了带有交互作用项的回归模型，这些交互作用项解释了基于谣言真实性和其他谴责情绪和自我意识情绪的转发数量。令RetweetCount i表示谣言级联i的转推数量。此外，让“谴责”i表示谴责他人情绪的比例，“自我意识”i表示自我意识情绪的比例“谎言”是真实的。在这里，我们将真实的谣言定义为虚假i = 0，将虚假的谣言定义为虚假i=1。我们调整了已知影响转发率的变量[8，47推文作者的关注者（Followersi）和被关注者（Followeesi）的数量、账户年龄（AccountAgei）、作者是否被Twitter 验证（Verified i）以及媒体是否被附加到推文（HasMediai）。这些因素中的每一个都来自Twitter API。我们z标准化了所有连续预测变量，以便于解释。基于上述变量，我们指定了以下通用线性模型进行分析：log（E（RetweetCounti|（1））=β0+β1谬误i+β2虚假i×谴责i+β3虚假i×自我意识i+β4谴责i+β5自我意识i（1）+β6关注者i+β7关注者i+β8账户年龄i+β9HasMediai+β10已验证i截距β0。3711假混合真WWW150010005000（一）1001010.1（B）1 10 100 100010K级联数政治健康其他（丙）级联数图1：2020年1月至2021年4月底期间在Twitter上传播的COVID-19谣言级联。(A)真实、虚假和混合谣言级联的月度计数（B）真实、虚假和混合谣言级联的互补累积分布函数（CCDF）(C)不同主题的谣言级联数。RetweetCount是非负计数变量，其方差大于均值。为了调整过度分散，我们利用负二项回归[8，58]。注意，因为我们估计了一个带有交互作用项的负二项回归模型，所以系数不能解释为一个单位（即，例如，标准差）增加，而所有其他预测变量保持不变。这是因为在具有交互作用项的非线性回归模型中，边际效应是解释变量的系数和水平的非线性函数[9]。相反，可以通过计算发病率比（IRR）在乘法尺度上解释系数，IRR等于相应变量系数的指数[9]。在这里，系数可以被解释为乘数的自然对数，给定预测变量增加一个单位，保持所有其他预测变量不变，预测的转发数量变化[9]。4结果我们的数据包括10，610个被转发的谣言级联2434万次。2019冠状病毒病谣言级联的总数在2020年3月达到顶峰，当时美国政府正在对2019冠状病毒病进行调查。S. 2020年 10月，即美国政府宣布冠状病毒疫情的前一个月，美国政府再次宣布全国进入紧急状态。S. 总统选举（图）1A）。三个事实核查组织已将四十六9%的谣言是假的，35。3%为真，17。7%，因为混合的真实性。虽然谣言级联的绝对数量在大流行期间有所减少，但虚假与虚假的相对份额有所增加。真实的谣言越来越多（图）。1A）。与虚假谣言相比，更大比例的真实谣言经历了100多个谣言级联（图1）。1B）。2019冠状病毒病谣言并不局限于健康话题（例如：例如，在一个实施例中，关于疫苗安全性的谣言相反，相当数量的COVID-19谣言涉及政治话题（例如：例如，在一个实施例中，对政治对手的真实或虚假指控）[17]。因此，我们应用主题建模将数据集中的谣言级联分类为三个（不相互排斥）主题：政治，健康和其他。图1C显示，2019冠状病毒病的谣言主题与Politics（76. 9%）、卫生（38。8%），而仅有12。2%关注其他主题（e.例如，在一个实施例中，阴谋论）。共34份。1%的谣言级联与政治和健康主题相关。回归分析：我们拟合了解释性回归模型，以评估道德情绪的变化如何与真实与真实的转发数量差异相关。虚假的谣言级联。在我们的回归分析中，我们遵循以前的工作[8，65]，控制已知影响转发率的变量，独立于主要预测因素，即。例如，关注者的数量、账户年龄等。作为基线，我们使用负二项回归开始回归分析，解释仅基于真实性标签和控制变量的转发数量（参见补充材料）。在这里，虚假的谣言（谎言=1）估计收到15个。66% 的转发比真正的谣言（内部收益率1. 16; p <0. 05）。01）。Subse-最近，我们扩展了负二项回归，包括谣言真实性和他人谴责情绪之间的相互作用项，以及谣言真实性和自我意识情绪之间的相互作用项（图11）。2A）。这两个相互作用项的系数估计值在统计上是显著的，这意味着虚假谣言的病毒性取决于源推文中嵌入的道德情感。具体来说，对虚假谣言的谴责情绪增加一个标准差，与26。99%的转推数量增加（内部收益率1. 27; p <0. 05）。01）。相比之下，虚假谣言的自我意识情绪增加一个标准偏差与23。43%的转发次数减少（内部收益率1. 23; p <0. 05）。01）。我们发现，其他谴责和自我意识的情感词对真实的谣言没有统计学上的显着影响总之，我们观察到，如果源推文嵌入了高比例的谴责他人的情感词，则虚假谣言比真相更具病毒性，而高比例的自我意识情感词则与病毒性传播较少有关（见图）。2B、2C）。跨主题分析我们还研究了道德的影响，不同主题的情感对于每个主题从图。在图1C中，我们生成了观察子集并重新估计了我们的回归模型（图1C）。3）。我们观察到道德情绪对转发数量的影响存在差异。谴责他人情绪的影响级联数美国宣布全国进入紧急状态谁假混合推荐口罩美国总统唐纳德·特朗普被确诊为COVID-19第59届美国选举美国接种开始CCDF（%）话题3712道德情绪塑造COVID-19社交媒体上的错误信息WWW（一）（B）（丙）谎言x谴责谎言x自我意识5000谎言的谴责40002000自觉的追随者30001500已验证的受关注者帐户年龄20001000HasMedia10000.0 0.5 1.00.00 0.25 0.50 0.751.00其他谴责0.00 0.25 0.50 0.75 1.00自我意识图2：谴责他人情绪的增加预示着虚假谣言的转发量更高，而自我意识情绪的增加则预示着转发量更少（A）负二项回归的系数估计值，95%置信区间。因变量是转发次数。（95%置信区间以灰色突出显示在转发数量上，健康类别的虚假谣言都是明显的（IRR 1.34; p <0.05）。01）和来自Politics类别的虚假谣言（IRR 1.61; p<0 .01）。01）。对于其他类别（样本量相对较小），系数指向相同的方向，但在共同的显著性阈值下不具有统计学显著性。对被删除推文的分析：Twitter等主要社交媒体平台通过删除错误信息，加大了打击其平台上错误信息传播的力度[6]。虽然Twitter API不提供对已删除的源推文内容的访问，但我们仍然能够分析它们的一些特征。作为探索性分析的一部分，我们发现3663条潜在的谣言起始推文已被删除（无论是Twitter还是用户自己）。其中绝大多数（68。35%）是潜在的虚假谣言。因此，尽管这些数字表明Twitter上有相当比例的虚假谣言已经被删除，但绝大多数虚假谣言仍在继续传播。对于这些谣言，我们的研究结果表明，谎言可能比真相更具病毒性额外检查1：大量探索性分析和检查验证了我们的结果并证实了它们的鲁棒性：（i）由于自我意识情绪可以被认为是他人谴责情绪的对应物，我们测试了另一种模型规范，其中我们包括了他人谴责情绪和自我意识情绪的情绪分数之间的差异，而不是两个单独的变量。与我们的主要分析一致，我们发现，如果源推文嵌入了高比例的谴责他人的情感词，则虚假谣言比真相更具病毒性，而高比例的自我意识情感词则与病毒性传播较少有关。（ii）在我们的主要分析中，我们关注的是明显真实或虚假的谣言。然而，17。7%的谣言被事实核查机构归类为混合真实性。我们测试了将混合性的谣言计数为真或假是否会影响我们结果的有效性。我们1详细结果见补充材料。我发现我们的结果是稳健的，谴责他人的情绪和混合真实性的组合与谴责他人的情绪和虚假真实性的组合一样具有病毒性。(iii)在我们的数据中，9。48%的谣言发起者已经启动了一个以上的转发级联。为了确保我们的模型不会因为这种非独立性而产生偏差，我们通过聚类删除了所有用户，并重新估计了模型。结果是稳健的，支持我们的发现。我们还使用每月固定效应重复了我们的分析，以控制由于不同的开始日期而导致的谣言级联的病毒性差异同样在这里，结果证实了我们的主要分析结果。（iv）我们重复了我们对谣言级联子集的分析，这些谣言级联是由Twitter验证或未验证的用户发起的。我们发现，我们的主要研究结果适用于这两个用户组。5讨论在这里，我们提供了证据，证明道德情绪在社交媒体上传播COVID-19错误信息我们使用了一个全面的COVID-19谣言数据集，这些谣言已经过三个独立的事实核查组织（snopes.com，politifact.com， truthorfiction.com）的事实核查，我们确定了其他谴责情绪虽然虚假谣言对成功克服这一流行病构成威胁，但对谣言如何在在线社交网络中传播的理解--即使是在非危机情况下--仍处于起步阶段。分析经过事实核查的谣言的传播动态在很大程度上可以推广到社交媒体上其他（未经事实核查的）谣言的传播[65]。我们发现，COVID-19的错误信息平均比真相更具病毒性，这与Vosoughi等人的研究直接相关。[65]，得出了类似的发现，但超出了COVID-19的背景之前的研究也表明，社交媒体上的错误信息可能会产生负面的离线后果。除其他情况外，这在人道主义危机[57]和选举[2- 4，29 ]期间已得到证实我们观察到，COVID-19的错误信息在社交媒体上广泛传播，真假真假级联尺寸级联尺寸3713WWW（一）胡志明市（B）政治学（丙）奥特布尔alsehood x谴责谎言x谴责谎言x谴责谎言x自我意识谎言x自我意识谎言x自我意识谬误谬误谬误谴责谴责谴责自我意识自我意识自我意识追随者追随者追随者关注者关注者关注者会计年龄会计年龄会计年龄已验证已验证已验证HasMediaHasMediaHasMedia-0.5 0.0 0.5 1.01.5-0.5 0.0 0.51.0−1 0 1 2图3：按主题过滤的谣言级联的负二项回归系数估计值和95%置信区间（A：HeaLT h，B：POLITICs，C：OT her）。因变量是转发次数。最不一样的关心。COVID-19错误信息不仅对个人构成严重的健康风险，而且还破坏了政治话语的完整性[50]。本研究的结果突出了道德情绪在谣言传播中的作用。以前的研究[8]广泛区分了社交媒体内容中的道德与非道德情感表达，而这项工作表明，道德情感的两个集群（自我意识与非道德情感）。谴责他人情绪）在真假谣言语境中对社会传播的影响是不同的我们观察到，如果源推文嵌入了大量谴责他人的情绪，则虚假谣言比真实谣言获得更多的转发，而我们发现了相反的模式，但幅度较小，自我意识情绪。另一个相关的发现是，对病毒性的其他谴责情绪的表达在健康错误信息和政治错误信息中都很明显这些发现的部分原因可能是在COVID-19的背景下社交媒体用户的高度两极分化在两极分化的辩论中，激进的思想和信念得到加强，更有可能转化为行动。因此，似乎合理的是，谴责他人的情绪的爆炸性混合加速了关于这些话题的虚假谣言在社交网络中的传播。从实践的角度来看，世界各地的政策倡议敦促社交媒体平台限制虚假谣言的传播[37]。虽然以前的研究已经研究了回应谣言级联的情绪[48，49]，但我们的工作强调了在引发谣言级联的源推文中考虑（道德）情绪的重要性。这些发现最终可以在机器学习模型中得到利用，以便更准确地检测虚假谣言。源推文的情感评分在传播过程开始时立即可用-在传播动力学特征稀缺的时间点[ 16 ]。我们的研究结果也可能与其他下游任务相关，例如教育应用。总而言之，考虑社交媒体帖子中的道德情感可能有助于未来的工作制定更有效的策略来对抗虚假谣言。这项工作受到观察性研究的典型限制我们报告相关性，避免提出因果关系。未来的工作应该寻求在受控实验室实验中证实我们的结论，特别是测试道德情感语言对态度和行为。我们的推断也受到我们数据的准确性和可用性的限制，特别是来自三个不同

下载后可阅读完整内容，剩余1页未读，立即下载