G1GPR9：对话中的语境化常识推理数据集

146 浏览量更新于2024-06-19 收藏 1MB PDF 举报

"G1GPR9是一个用于对话中语境化常识推理的二元对话数据集，包含了原因、后续事件、先决条件、动机和情绪反应等五种类型的推理任务。该数据集由5,672个对话的53,105个推断组成，旨在帮助理解和生成对话中的常识知识。" 在当今数字化社会，对话内容在互联网上爆炸式增长，这些对话包含了丰富的信息，反映了人们如何交流思想和情感。对话理解的一个关键挑战是能够进行语境化常识推理，即理解对话中未明示但可以推断出的信息。G1GPR9数据集就是为了应对这一挑战而创建的。该数据集包含五种不同类型的推理任务： 1. 原因：推断某句话或行为背后的原因，例如，为什么一个人会提出某个请求或做出某种反应。 2. 后续事件：预测对话中下一个可能发生的事情，这有助于理解对话的发展方向。 3. 先决条件：识别完成某项活动或达成某个目标所必需的条件。 4. 动机：理解说话者的意图或动力，为何他们选择特定的行动或表达方式。 5. 情绪反应：识别对话中未直接表达的情绪，以及这些情绪如何影响对话的进程。 G1GPR9数据集的构建过程涉及了对大量对话的分析，以便标记出这些推理类型。通过使用这个数据集，研究者可以训练模型执行生成和判别任务，比如生成原因或后续事件，或者识别先决条件、动机和情绪反应。这不仅有助于提升对话理解的深度，还为对话系统和人工智能的发展提供了重要的资源。实验结果显示，G1GPR9数据集对于训练和评估对话推理模型非常有价值。它揭示了对话中心的常识知识在处理语境冲突和理解复杂对话情境中的关键作用。例如，图1b所示的例子中，通过上下文可以推断出汤姆因为厌倦了重复的晚餐，所以想去麦当劳吃快餐，这展示了常识推理在解释对话中的重要性。此外，G1GPR9数据集的开放获取性促进了学术界和工业界的共同研究，推动了对话理解、情感分析和常识推理等相关领域的进步。未来的研究可能会扩展到多模态语境，将视觉信息与对话内容结合，进一步增强模型的理解能力。 G1GPR9数据集是研究对话推理和语境化常识理解的重要工具，它对于构建更加智能、自然的对话系统具有深远的影响。通过深入研究这个数据集，我们可以期望开发出更加人性化的AI助手，更好地理解和适应人类的沟通方式。

+v：mala2277获取更多论

文

∼

2.3

目标话语选择

给定对话

，我们选择目标话语如下：

•

我们首先确定D中的目标话语数：如果D具

有

•

我们将D分成2我们从每个部分中选择大致

相同数量的排名靠前的言论。我们称这组外

差

为

使用句子排名算法（

Erkan

和

Radev

，

2004;Mihalcea

和

Tarau

，

2004

）和嵌入式

BERT

（Reimers和Gurevych，2019 a）进行排名。

•

我们还选择

了

D中最长的话语和包含短语的

话语，如I我们称这组外差

为

.集合

和

可能

不相交。

•

集合x

由D的最后一个发音组成。

我们从集合x

，

中为目标发声率选择推理

类型，如下所示：

•

从x

到x

：

–

后续事件：80%的目标。

–

原因和先决条件：60%的目标。

–

唯一原因：

28%

的目标。

–

独家先决条件：12%的目标。

•

从x

开始：所有目标的动机。

•

Fromx

：监听者对所有目标的反应。

2.4

G1GPR9

的质量保证

通过以下步骤确保数据集质量

•

首先，我们随机抽取

个对话，并手动注

释其中的所有问题（如2.1节所示）。然后，

每个注释者都会根据这些对话进行评估，如

果我们批准了他/她95%的注释，则会选择他/

她进行注释任务

•

在注释过程中，我们不断地审查并向注释者

提供反馈。注释者也被指示修改他们的答案。

•

注释完成后，我们雇用了三个额外的注释

者，他们手动检查注释的样本并对其可接受性

进行评分这些注释者达成共识，批准了86%的

样本。从数据集中删除不具有多数一致性的样

本

你好，珍妮.你要搬去伦敦是真的吗？B（U

）：是的，它

是。是什么让你决定这么做的？B（U

）：主要是工作。

我肯定能在那里找到工作。A

（

）：你可能是对的。但是

你要住在哪里？我希望我能找到一套公寓与人合住.这样会

更便宜。A（

）：是的，这是个好主意。你要带着你的狗

吗？不，我不这么认为。我父母一直在照顾他，我想他在

城里不会开心的。A

（

）：你可能是对的。但是你搬到这

么大的地方，特别是在一个小村庄里生活过之后，你就不

怕吗？B

（

）：不是真的。我想我会玩得很开心的。那里

有很多事情可做;我希望我不会太想念乡村，我可以随时回

来参观。嗯，我只是希望你安顿下来后能邀请我住下. B

（

）：当然可以。

目标-u

;推论：原因;注释：作为一个消费型城市，在伦敦

找一个合适的住处是相当困难的

目标-

;推论：原因;注释：金妮意识到像伦敦这样的城市

将为她提供高质量的生活

目标-

;推理：后续事件;注释：监听者给珍妮一个主意，

让她在一些搜索室友的在线门户网站上找到公寓，以及很

多更便宜的选择。

目标-u

;推理：后续事件;注释： Jenny询问了伦敦的一个

社交俱乐部，并要求他们的会员资格来利用她的空闲时

间。

目标-

;推理：先决条件;注释：珍妮已经完成了她的学业.

目标-

u12

;推理：先决条件;注释：珍妮和听者是好朋友.

目标-

;推论：动机;注释：珍妮对找个人做室友以节省房

租持乐观态度.

目标-

;推论：反应;注释：听者为珍妮感到高兴，并期待

被珍妮邀请去伦敦

表2：用目标话语和推断类型标记的G1GPR 9中的注释

示例。推理类型

原因、结果、前提、动机和反应

分别对

应于第

2.1

节中的问题

、

和

。

注释数据集的统计数据如表3所示。表2中还

显示了来自G1GPR 9的许多注释示例。

2.5

G1GPR9

的特点

在表3之后，G1GPR 9中的大多数（59%）推

论本质上是因果关系。同样，大约80%的推论

是推测性的，与上下文一致。因此，与CIDER

相比，

G1GPR 9

在其应用方面更加通用

（

Ghosal et al.

，

2021a

），其仅包含显式上下

文推断。

G1 GPR 9

还包含各种常识知识

关于G1GPR9的

我们在

G1GPR9

上设计了生成式和多项选择问

题回答任务，以评估对话级基于常识的推理能

力。

剩余18页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

G1GPR9：对话中的语境化常识推理数据集

对话数据集

基于数据挖掘分析GPR35表达对肺腺癌预后的影响.pdf

改进型粒子群算法及其在GPR全波形反演中的应用.pdf

RGPR:探地雷达 (GPR) 数据处理和可视化

GPR_GPR预测_gpr算法程序_GPR_高斯过程回归_GPR预测

gpr.rar_GPR_GPR MUSIC_SFCW GPR_SFCW matlab_gpr matlab

gpr1

GPR-Data-Simulation.rar_GPR数据处理_信号处理 GPR_地雷 数据_探地雷达仿真_探地雷达数据

小波全分量层相乘滤波及其在GPR反射目标提取中的应用 (2007年)

GPR.zip_GPR_GPR数据_探地雷达_探地雷达数据_雷达处理软件

最新资源

GPR-Data-Simulation.rar_GPR数据处理_信号处理 GPR_地雷数据_探地雷达仿真_探地雷达数据