自动化事实核查：剑桥大学NLP研究综述

需积分: 15 19 浏览量更新于2024-07-09 收藏 790KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"这篇论文是剑桥大学计算机科学和技术系的研究者所著，全面综述了自动事实核查的现状和挑战。随着信息和错误信息在当今媒体环境中的快速传播，事实核查的重要性日益凸显。研究者们正在利用自然语言处理、机器学习、知识表示和数据库技术来开发自动化的方法，以判断声明的真伪。本文深入探讨了自动事实核查与相关任务和学科的联系，并概述了现有的数据集和模型，旨在统一不同定义并识别共同概念。同时，论文指出了未来研究面临的挑战。" 在当前的信息时代，事实核查是确保公众获取准确信息的关键步骤。传统的事实核查过程依赖于人工，这在面对海量信息时效率低下。因此，自动事实核查的研究逐渐成为热点。自然语言处理（NLP）在这里起到了核心作用，通过理解和解析声明的语言结构，系统可以分析其逻辑和语义。机器学习则用于训练模型，以识别声明中的模式和特征，预测其真实度。知识表示和数据库技术帮助系统存储和检索相关事实，以便对比和验证声明。论文首先介绍了事实核查任务的基本概念，即对书面或口头陈述的真实性进行评估。在新闻报道和公共辩论中，这种能力至关重要。接着，作者回顾了自动事实核查领域的发展历程，包括早期的工作和最近的创新。他们讨论了不同方法如何结合NLP技术，例如文本摘要、情感分析和实体识别，以及机器学习算法，如支持向量机和深度学习模型。此外，论文对现有的事实核查数据集进行了详细分析，这些数据集通常包含了真实的声明和相应的核查结果，为模型训练和评估提供了基础。数据集的多样性反映了事实核查的复杂性，包括事实声明的来源、主题和真实性级别。作者还讨论了不同模型的优缺点，以及在解决特定问题时的有效性。论文进一步探讨了自动事实核查与其他相关领域的交叉，如信息检索、虚假新闻检测和语义推理。这些关联有助于拓宽研究视野，推动跨学科的合作。作者强调了未来研究面临的挑战，如处理模糊和多义性、对抗性攻击以及提升模型的解释性和透明度。这篇综述论文为自动事实核查的研究提供了全面的视角，对于理解该领域的进展和未来方向具有重要意义。通过整合现有的研究成果，它为后续的研究工作提供了宝贵的指导，并指明了可能的创新路径。

资源详情

资源推荐

Dataset Input #Inputs Evidence Verdict Sources Lang

CrimeVeri (Bachenko et al., 2008) Statement 275 7 2 Classes Crime En

Politifact (Vlachos and Riedel, 2014) Statement 106 Text/Meta 5 Classes Fact Check En

StatsProperties (Vlachos and Riedel, 2015) Statement 7,092 KG Numeric Internet En

Emergent (Ferreira and Vlachos, 2016) Statement 300 Text 3 Classes Emergent En

CreditAssess(Popat et al., 2016) Statement 5,013 Text 2 Classes Fact Check/Wiki En

PunditFact (Rashkin et al., 2017) Statement 4,361 7 2/6 Classes Fact Check En

Liar (Wang, 2017) Statement 12,836 Meta 6 Classes Fact Check En

Verify (Baly et al., 2018) Statement 422 Text 2 Classes Fact Check Ar/En

CheckThat18-T2 (Barrón-Cedeño et al., 2018) Statement 150 7 3 Classes Transcript En

Snopes (Hanselowski et al., 2019) Statement 6,422 Text 3 Classes Fact Check En

MultiFC (Augenstein et al., 2019) Statement 36,534 Text/Meta 2-27 Classes Fact Check En

Climate-FEVER (Diggelmann et al., 2020) Statement 1,535 Text 4 Classes Climate En

SciFact (Wadden et al., 2020) Statement 1,409 Text 3 Classes Science En

PUBHEALTH (Kotonya and Toni, 2020b) Statement 11,832 Text 4 Classes Fact Check En

X-Fact (Gupta and Srikumar, 2021) Statement 31,189 Text 7 Classes Fact Check Many

cQA (Mihaylova et al., 2018) Answer 422 Meta 2 Classes Forum En

AnswerFact (Zhang et al., 2020) Answer 60,864 Text 5 Classes Amazon En

NELA (Horne et al., 2018) Article 136,000 7 2 Classes News En

BuzzfeedNews (Potthast et al., 2018) Article 1,627 Meta 4 Classes Facebook En

BuzzFace (Santia and Williams, 2018) Article 2,263 Meta 4 Classes Facebook En

FA-KES (Salem et al., 2019) Article 804 7 2 Classes VDC En

FakeNewsNet (Shu et al., 2020) Article 23,196 Meta 2 Classes Fact Check En

FakeCovid (Shahi and Nandini, 2020) Article 5,182 7 2 Classes Fact Check Many

Table 2: Summary of factual veriﬁcation datasets with natural inputs. KG denotes knowledge graphs. ChectThat18

has been extended later (Hasanain et al., 2019; Barrón-Cedeño et al., 2020; Nakov et al., 2021). NELA has been

updated by adding more data from more diverse sources (Nørregaard et al., 2019; Gruppi et al., 2020, 2021)

Next, we discuss the inputs to factual veriﬁca-

tion. The most popular type of input to veriﬁ-

cation is textual claims, which is expected given

they are often the output of claim detection. These

tend to be sentence-level statements, which is

a practice common among fact-checkers in or-

der to include only the context relevant to the

claim (Mena, 2019). Many existing efforts (Vla-

chos and Riedel, 2014; Wang, 2017; Hanselowski

et al., 2019; Augenstein et al., 2019) constructed

datasets by crawling real-world claims from ded-

icated websites (e.g. Politifact) due to their avail-

ability (see Table 2). Unlike previous work that

focus on English, Gupta and Srikumar (2021) col-

lected non-English claims from 25 languages.

Others extract claims from speciﬁc domains,

such as science (Wadden et al., 2020), cli-

mate (Diggelmann et al., 2020), and public

health (Kotonya and Toni, 2020b). Alternative

forms of sentence-level inputs, such as answers

from question answering forums, have also been

considered (Mihaylova et al., 2018; Zhang et al.,

2020). There have been approaches that consider

a passage (Mihalcea and Strapparava, 2009; Pérez-

Rosas et al., 2018) or an entire article (Horne et al.,

2018; Santia and Williams, 2018; Shu et al., 2020)

as input. However, the implicit assumption that

every claim in it is either factually correct or in-

correct is problematic, and thus rarely practised by

human fact-checkers (Uscinski and Butler, 2013).

In order to better control the complexity of

the task, efforts listed in Table 3 created claims

artiﬁcially. Thorne et al. (2018a) had annota-

tors mutate sentences from Wikipedia articles to

create claims. Following the same approach,

Khouja (2020) and Nørregaard and Derczynski

(2021) constructed Arabic and Danish datasets

respectively. Another frequently considered op-

tion is subject-predicate-object triples, e.g. (Lon-

don, city_in, UK). The popularity of triples as in-

put stems from the fact that they facilitate fact-

checking against knowledge bases (Ciampaglia

et al., 2015; Shi and Weninger, 2016; Shiralkar

et al., 2017; Kim and Choi, 2020) such as DB-

pedia (Auer et al., 2007), SemMedDB (Kilicoglu

et al., 2012), and KBox (Nam et al., 2018). How-

ever, such approaches implicitly assume the non-

trivial conversion of text into triples.

3.2 Evidence

A popular type of evidence often considered is

metadata, such as publication date, sources, user

proﬁles, etc. Metadata provides insights that are

useful for claim detection, for example, domain-

speciﬁc metadata such as likes, or numbers of re-

posts. It offers information complementary to tex-

tual sources or structural knowledge, especially

when the latter are unavailable (Wang, 2017; Pot-

剩余26页未读，继续阅读

syp_net

粉丝: 158
资源: 1187

自动化事实核查：剑桥大学NLP研究综述

事实抽取与验证研究综述

剑桥初级英语是什么水平

剑桥少儿英语预备级pdf

flac3d修正剑桥模型

剑桥高级英语语法中文版pdf

英国大学物理前十list

人脸识别国内外研究现状

修正剑桥模型matlab

导师预约系统国外研究现状

flac3d剑桥模型

修正剑桥模型 umat

相机运动估计国内外研究现状

修正剑桥模型代码

人工智能研究生哪所学校好

图像分类国内外发展现状，1000字以上。

abaqus修正剑桥子程序

世界排名前十的学校分别是那些

最新资源