连续少镜头关系学习：嵌入约束与数据增强策略

PDF格式 | 1.08MB | 更新于2024-06-18 | 190 浏览量 | 举报

嵌入空间正则化和数据扩充的连续少镜头关系学习方法在当前的自然语言处理领域，关系提取（RE）作为关键任务，其目标是识别文本中实体之间的关系，如"Kamala Harris出生于加利福尼亚州奥克兰，1964年10月20日"中的"出生日期"。传统RE方法通常依赖于固定关系集，但这种做法限制了它们处理开放词汇问题的能力，即关系类型的多样性随新数据增加而扩展。为了解决这一挑战，论文提出了连续关系学习（CRL）的概念，它允许模型通过一系列任务学习关系知识，关系集随时间变化。然而，实际应用中遇到的主要问题是，获取大量标记数据以支持新任务的训练往往是昂贵且耗时的，这在现实场景中难以满足。为了应对这种限制，研究者秦成伟和Shafiq Joty提出了连续少镜头关系学习（CFRL），一个更具挑战性和实用性的问题。CFRL假设后续任务的训练数据相对较少，这与CRL不同，后者假设每个任务都有充足的数据。论文的核心贡献在于，通过结合嵌入空间正则化和数据扩充策略，解决了在少量标记数据下学习新关系模式并保持对先前任务知识的记忆问题。嵌入空间正则化强调了在连续学习过程中维持关系嵌入的稳定性，防止新任务学习导致的特征分布与之前任务不兼容，从而避免了灾难性遗忘。通过这种方法，模型能够更好地适应新任务，同时保持对已有关系知识的有效利用。另一方面，数据扩充策略通过自我监督的方式增加了额外的相关数据，进一步增强了模型在新任务上的泛化能力。这样，即使在资源有限的情况下，模型也能有效地扩展其关系识别能力，适应不断变化的关系类型。作者通过大量的实验验证了他们的方法在CFRL设置下的有效性，证明了在有限的标记数据条件下，这种方法能够有效地学习新的关系模式，同时保持对之前任务的良好记忆。这对于那些数据获取成本高昂的领域，如新闻摘要、搜索引擎优化或智能问答系统，具有重要的实际应用价值。这项工作为解决关系提取任务中的数据稀缺问题提供了一种创新且实用的方法。

展开

+v：mala2277获取更多论

文

火

车

：

CITD

火

车

∈

火

车

火

车

∈

火

车

保存在M

中

火

车

火

车

：

合并两

个

数据源

算法1在时间步长k

处的训练过程

•

BERT 我们采用

BERT

底座

，有12层，

需要：当前任务

的训练集

和关系集

，当前记

忆

体

-1

和

已知关系集

，模型

，相似度

模型

，

以及未标记的文本语料库。

如果

，则

个

初始任务

110M

参数。由于新的任务很少，我们只微调

了第

个编码层和额外的线性层。我们在实体

周围

2：

火车

‘@’ for the tail entity) in a given labeled

3：else dfew-shot任务

4：从

中

的每个样本中使用

选择

相似样本，并将

其存储在A中

列车火车

以提高编码器我们使用[CLS]标记特征作为输

入序列的表示。

第

章：

一

个

女人

6：如果结束

：我对每个关系

初始化

：对于

，

. . .

，

iter

：

PDATE

，

新

的

训练新的任务

10：结束

：

SELECT

关键样本来自

对于每个关系

∈

：

巴

莱克

克

-1

3.3.2使用新数据

在时间步

，为了更好地理解新关系，我们在

扩展

数据集

模型

首先

编码

每个新关系的名称

∈

到它的

R R

−

：

更新内存

表示

∈IR

向前传球

克

：对于

，

. . .

，

iter

：

PDATE

，

阿利

翁

：每个

关系

的

UP DATE

18：结束

然后，我们通过最小化来优化参数（

）

引入一个损失新模型

，

该模型由交叉熵损失、

多边缘损失和成对边缘损失组成

交叉熵损失

用于关系分类如下。

分析数据以学习新的关系模式，

记住以前的知识（§3.3.4）。我们

j =1

，

exp

（

）

，

）

log

exp

（

）

，

））

也同时更新所有

（

，

）

∈

列

l=1

（一

）

关系，这就意味着使一个边界通过当前模

型。迭代地完成学习和更新以用于收敛。

对于少量任务中的数据增强（

§ 3.4

），我们

使用微调的

BERT

从未标记的维基百科语料库中

选择具有高关系相似性得分的可靠样本

（Devlin et al. ，2019），其用作关系相似性

模型

。在一致性的利益，我们首先提出了一

般的学习方法，其次是增强过程的少数拍摄学

习。

3.3

一般学习过程

我们首先介绍编码器网络，因为它是

其中，

是

步骤

处的

所有已知关系

的集合

，

（

）是用于测量两个向量之间的相似性的

函数（

例如，

余弦相似性或L2距离），δ

，

是

克罗内克δ函数-如果a等于b，则δ

在推理中，我们选择关系标签，

具有与输入句子的最高相似性（等式10）。

（八）。为了确保一个例子与真实关系具有最

高的相似度，我们还设计了两个基于边缘的损

失，这增加了一个例子和真实标签之间的分

数，同时降低了错误标签的分数。第一种是多

利润损失，定义为：

是整个框架的基本组成部分

3.3.1

编码器网络

（

，

）

∈

，

（二

更）

暹罗编码器（

）的目的是从输入中提取输入

可以是带标签的句子或关系的名称。我们采

用两种编码器：

为了与以前的工作进行公平的比较，我们使

用与

Han

等人相同的架构。（

2020

年）。它采

用

GloVe

嵌入（

Pen-ningtonet al.

，

2014

），并

通过Bi-

−

（

）

，

）

（

）

，

）

其中

，

是

R k

中

的正确关系

index

，

满足

，

并且m

是裕度值。

损失试图确保类

内紧凑性

，同时增加类间距离。的

第二个是成对边际损失L

：

最大的

。

，

−

（

）

，

）+g（f

（x

）

，

）

LSTM

（

Hochreiter

和

Schmidhuber

，

1997

）。

（

，

）

∈

列

（三

）

下载后可阅读完整内容，剩余15页未读，立即下载

身份认证购VIP最低享 7 折!

30元优惠券

cpongm

粉丝: 6

连续少镜头关系学习：嵌入约束与数据增强策略

基于深度学习的正则化矩阵分解推荐系统.pdf

Matlab_基于结构正则化的多任务学习.zip

深度学习中的半监督嵌入方法

探索HTML中SVG嵌入的多样化技术方法

SemEval2010 Task8数据集深度学习关系抽取研究

掌握URL正则表达式匹配技巧

昆仑通态嵌入版ModBusTcp数据转发驱动解决方案

WPF ComboBox扩展控件实现列表嵌入与自动数据绑定

利用Cao法求解最优嵌入维数与重构相空间

掌握正则表达式的终极工具 RegexBuddy 4

最新资源