没有合适的资源?快使用搜索试试~ 我知道了~
0认知机器人2 (2022) 234–2410ScienceDirect提供的内容列表0认知机器人0期刊主页:http://www.k eaipublishing.com/en/journals/cogniti ve-robotics/0通过实体角色识别进行实体和关系的联合提取0韩 熙,刘启明0西安理工大学 计算机科学与工程学院 陕西 西安 中国0文章信息0关键词:关系提取 重叠关系提取信息提取0摘要0从非结构化文本中联合提取实体和关系是信息提取的基本任务,也是构建大型知识图谱的关键步骤,实体和关系构建为(subject, relation, object)或(s, r,o)的关系三元组。尽管三元组提取取得了极大的成功,但由于实体重叠等因素,仍然存在持续的挑战。最近的工作向我们展示了联合提取模型的出色性能,然而这些方法仍然存在一些问题,比如冗余预测问题。传统方法解决重叠问题需要在数据集中定义的全部关系类别下进行三元组提取,然而句子中的关系数量远小于全部关系类别,这导致了大量冗余预测。为了解决这个问题,本文将任务分解为两个步骤:实体和潜在关系提取以及三元组的实体语义角色确定。具体来说,我们设计了几个模块来分别提取句子中的实体和关系,并利用这些实体和关系构建可能的候选三元组,并预测实体在关系约束下的语义角色(主语或宾语),以获得正确的三元组。总的来说,我们提出了一个模型,用于在关系约束下识别三元组中实体的语义角色,可以有效解决冗余预测的问题。我们还在两个广泛使用的公共数据集上评估了我们的模型,我们的模型在NYT和WebNLG上分别达到了90.8和92.4的F1分数,取得了先进的性能。01. 引言0从非结构化文本中提取实体和关系是构建知识图谱的关键步骤。实体和关系构建为(subject, relation, object)或(s, r,o)的关系三元组。尽管传统工作取得了巨大成功,但重叠实体的问题大多被忽视,这使得完全提取句子中的所有关系三元组变得具有挑战性。重叠关系提取的问题亟待解决。早期关系提取的任务通常采用管道方法[1,2,3]。管道方法首先识别句子中的所有实体,然后在关系上对每个实体对进行分类,然而,这种方法存在错误传播的问题。为了解决错误传播的问题,近年的研究提出了联合提取模型[4-7],联合模型认为实体识别和关系分类是相关的。然而,现有方法大多忽视了重叠关系的问题。关系重叠指的是一句话可能包含多个实体关系三元组相互重叠的事实。表1展示了两种重叠关系的形式:单实体重叠(SEO)和实体对重叠(EPO)。解决SEO和EPO问题的现有模型根据主流方法分为两大类:基于文本生成的方法和基于序列标注的方法。文本生成型模型使用编码-解码架构逐个提取单词或三元组[6,8-10]。序列标注型0�通讯作者。0电子邮件地址:443381197@qq.com(X.韩)。0https://doi.org/10.1016/j.cogr.2022.11.001 收稿日期2022年9月21日; 修订稿收到日期2022年10月21日; 2022年11月8日接受日期 在线发表日期2022年11月17日2667-2413/© 2022 The Authors. Publishing Services by Elsevier B.V. on behalf of KeAi Communications Co. Ltd. 本文是根据CCBY-NC-ND许可协议(http://creativecommons.org/licenses/by-nc-nd/4.0/)的开放获取文章。235 0X.韩和Q.-M.刘 认知机器人学 2(2022)234-2410表1 正常、单实体重叠(SEO)和实体对重叠(EPO)重叠模式示例。0句子三元组0正常[美国]总统[Biden]与[特斯拉]的CEO[埃隆∙里夫∙马斯克]会面。0(美国,总统,拜登)(埃隆∙里夫∙马斯克,特斯拉的CEO)0SEO[周星驰]是一位著名的喜剧演员,出生于[中国],在[香港]。0(周星驰,国籍,中国)(周星驰,出生地,香港)0EPO[周杰伦]是[“夜曲”]的作曲家和歌手。(周杰伦,作曲家,夜曲)(周杰伦,歌手,夜曲)0模型使用标签来标记序列中实体的起始和结束位置,一些方法可以同时识别关系[5,11-13]。TPLinker[14]提出了一种独特的三次握手方法,以一步完成提取,有效解决了联合提取模型的错误累积问题。尽管这些研究取得了极大的成功,仍然存在一个需要解决的问题:冗余预测。结合Pipeline[15]和联合提取的优势,如果我们能直接识别句子中的实体和关系,并构建这些实体和关系的候选三元组,并区分不同三元组中实体的语义角色(主语或宾语),那么我们就能准确预测句子中存在的关系,从而解决冗余预测问题。例如,在句子“北京是中国的首都”中,我们可以构建候选三元组(北京,是,中国)并预测北京和中国在关系“是”的语义角色,从而得到正确的三元组(北京,是,中国)。本文提出了一种新颖的三元组提取模型,可以在文本中提取实体和关系,识别实体对是否具有特定关系以及在此关系约束下实体的语义角色,大大减少了冗余预测。我们在两个广泛使用的数据集上评估了当前模型:NYT[16]和WebNLG[17]。实验结果表明,我们的模型在两个数据集上均取得了先进的性能。总之,本文的贡献如下:0•我们提出了一种新的方法,将关系抽取的任务转化为判断不同关系下实体角色的问题,从而解决了重叠关系抽取的问题,以及重叠关系抽取中的冗余预测问题。0• 上述思想被实例化为一个完整的重叠关系抽取框架,能够利用BERT的先验知识有效地预测不同关系下实体的语义角色。0•我们在两个公开可用的数据集上进行了广泛的实验,结果表明,与基线相比,当前模型取得了先进的性能。0总的来说,本文包括六个章节,即引言、相关工作、方法、实验、实验结果与分析以及结论。在方法部分,我们详细介绍了模型的完整架构以及每个模块的细节。在实验部分,我们介绍了实验的具体参数设置和评估方法。在实验结果分析部分,我们展示了我们模型在公共评估数据集上的性能,并且验证了我们模型在重叠关系抽取方面的性能,并对错误进行了分析。02. 相关工作0以往的关系抽取工作[1, 3,18]主要采用了流水线方法,分为两步:实体识别和关系分类。然而,流水线方法忽略了两个任务之间的连接,为了解决这个问题,一些学者提出了联合抽取模型[4, 19,20],使用编码器提取共享特征,但这些工作是基于难以泛化的手动特征提取。神经网络模型能够自动提取文本特征,在三元组抽取任务中取得了巨大成功。郑[5]提出了一个统一的标记框架,可以将实体和关系整合到标记中,将关系抽取任务转化为序列标记任务。孙[21]提出了一种基于最小风险训练的方法,可以优化全局句子级损失。Bekoulis[22]将关系分类转化为多头选择问题。吴[23]提出了一种通过定位目标实体并传递信息来丰富实体信息的方法。然而,所有这些工作都忽略了重叠关系抽取问题。解决重叠关系抽取的主要方法有两种:序列标记方法和文本生成方法。序列标记模型在序列中标记实体位置,牛[24]使用GCN,在编码时引入了依赖句法信息,丰富了文本特征的结构化信息,然后使用序列标注方法取得了一定成功。魏[11]提出了CasRel框架,首先识别句子中可能的主语,然后为每个主语和每个关系解码相应的宾语,在解决重叠问题方面取得了巨大成功。赵[13]在CasRel框架中引入了关系嵌入,并结合图神经网络和门控网络将关系特征与标记特征融合,从而为模型引入了更丰富的信息。李[25]提出了一种关系标签感知的注意力,使用BERT对关系标签进行编码,通过将编码与句子特征相结合计算关系感知注意力,然后将两种特征结合起来以提高模型性能。罗[26]认为关系是有方向的,并结合关系方向特征,提出了双向树标签,有效解决了重叠关系问题。王[27]在CasRel的基础上使用IDCNN(迭代扩张CNN)和Bi-LSTM对句子进行编码,并采用注意力机制获取句子中更丰富的语义特征,以增强模型的有效性。陈[28]提出了一个统一的框架𝑝 𝑠𝑡𝑎𝑟𝑡 𝑖 = 𝜎(𝑊 𝑠𝑡𝑎𝑟𝑡 ℎ 𝑖 + 𝑏 𝑠𝑡𝑎𝑟𝑡 )(1) 𝑝 𝑒𝑛𝑑 𝑖 = 𝜎(𝑊 𝑒𝑛𝑑 ℎ 𝑖 + 𝑏 𝑒𝑛𝑑 )(2) 236 0X. 韩和刘启明 认知机器人学 2 (2022) 234–2410图1.模型架构图,实体角色识别模块中的0/1/2表示当前构建的候选三元组中实体对的正确模式。例如,对于候选三元组(e1,R,e2),当预测结果为2时,意味着正确三元组中的e2是R下的主语,e1是宾语,正确的三元组应该是(e2,R,e1),当预测结果为1时,则相反,0表示e1,e2之间没有关系R。0联合提取显式和隐式关系三元组。引入了二元指针网络来探索可以通过关系隐式连接的实体对,以顺序提取与每个单词相关的重叠三元组,并在外部存储器中保留先前提取的三元组信息。为了推断隐式三元组的关系类型,在模型中引入了实际的关系推理模式,并且这些模式被关系网络捕获。文本生成方法使用编码器-解码器架构,类似于机器翻译。曾[6]提出了一种基于复制机制的方法,通过复制实体使其参与不同的三元组,然而,这种方法无法解决多标记实体生成问题。曾[29]提出了一个多任务学习框架来解决多标记实体生成问题。纳亚克[9]提出了一个基于指针网络的解码框架,用于复制机制,取得了性能改进。白[30]设计了一个两指针网络结构,通过多层神经网络进行编码,并结合自注意机制分别识别实体的起始位置和结束位置,从而在复制过程中涉及完整的实体,并在NYT数据集上获得了性能提升;然而,该模型没有考虑实体对和关系之间的交互。然而,这些方法存在冗余预测的问题,在提取三元组时通常需要在完整关系下进行预测。与这些方法不同,我们提出的模型能够识别句子中的实体和关系,然后构建候选三元组,最终我们在少量关系约束下预测候选三元组中实体的角色,大大减少了冗余计算。03. 方法0我们模型的核心思想是识别不同关系下实体的语义角色。模型架构如图1所示,由实体识别模块、关系识别模块和实体角色识别模块组成。我们首先识别句子中可能的实体和关系,并构建候选三元组,最后识别这些三元组中实体的角色(主语或宾语)。03.1. 问题定义0关系抽取的目标是识别给定句子中存在的所有三元组。例如,给定长度为 n 的句子 � = { � 1 , � 2 , … , � � } 作为模型的输入,模型的输出为 � ( � ) = {( �, �, � ) | �, �∈ �, � ∈ � } ,其中 E 和 R是句子中的实体和关系集合。本文将这个问题分解为实体提取、关系预测和实体角色识别三部分。我们选择使用BERT[31]预训练模型作为我们的编码器,对文本上下文信息进行编码。文本特征表示为[ � 1 , � 2 , … , � � ] = ���� ( [ � 1 , � 2 , … , � � ] ) 。03.2. 实体识别0与CasRel [11] 不同,我们使用二进制解码器标记所有可能实体的起始和结束位置,具体如下:X. Han and Q.-M. Liu Cognitive Robotics 2 (2022) 234–241 𝑅 1 , 𝑅 2 , … , 𝑅 𝑛 = 𝑊 𝑟 𝑟 1 , 𝑟 2 , … , 𝑟 𝑛 + 𝑏 𝑟 (3) 𝑆𝑐𝑜𝑟𝑒𝑠 = 𝑆𝑜𝑓𝑡𝑚𝑎𝑥 𝑄𝐾 𝑇 √𝑑 𝑘 𝑉 (4) 𝑃 𝑟𝑒𝑙 𝑖 = 𝜎 𝑊 𝑟𝑒𝑙 𝑆𝑐𝑜𝑟𝑒𝑠 + 𝑏 𝑟𝑒𝑙 (5) 𝜀 = 𝑁 ×𝑀 (𝑒 𝑖 = ℎ 𝑠𝑡𝑎𝑟𝑡 + ℎ 𝑒𝑛𝑑 (7) 237 0其中,� ����� � , � ��� � 表示输入句子中第 � 个标记为实体起始和结束的可能性,� ����� , � ��� , � ����� , � ���0可学习的参数,� () 是 ������� 激活函数。如果标记为实体的起始或结束的标记概率超过一定阈值,则标记为1,否则标记为0。03.3. 关系预测0在本节中,我们使用关系注意力机制来识别句子中存在的潜在关系,并计算给定句子中的标记与关系嵌入之间的相似性,以获取句子中的潜在关系。参考之前的工作[13],我们使用二进制解码器来标记所有可能实体的起始和结束位置,具体如下:0其中,� � 表示与第 � 个关系标签对应的 ��� − ��� 向量,� � 和 � � 是可学习的参数。我们使用高维关系嵌入矩阵 � 作为查询向量,句子隐藏层 �作为关系注意力计算的键和值向量,并使用线性层来获得每个关系在句子中存在的概率,具体计算公式如下:0其中,� ��� � 是句子中存在第 � 个关系的概率,� ��� 和 � ��� 是可学习的参数,� 是 ������� 激活函数。如果一个关系在句子中的存在概率超过一定阈值,则认为该关系存在。03.4. 实体语义角色识别0通过使用上述任务的结果构建候选三元组,我们可以枚举不同实体对和关系的组合。当给定的句子实体数量为 M,关系数量为 N 时,三元组的数量 | � |如下:0例如,如果句子"北京是中国的首都"有 � = 2 个实体(北京,中国),� = 1 个关系(是...的首都),我们可以构建候选三元组:� ={(北京,是...的首都,北京),(北京,是...的首都,中国),(中国,是...的首都,中国)}我们需要实体和关系的特征表示来构建三元组的特征0例如,如果句子"北京是中国的首都"有 � = 2 个实体(北京,中国),� = 1 个关系(是...的首都),我们可以构建候选三元组:� ={(北京,是...的首都,北京),(北京,是...的首都,中国),(中国,是...的首都,中国)}我们需要实体和关系的特征表示来构建三元组的特征。为了使不同长度的实体特征跨度统一,我们使用实体起始位置标记和结束位置标记的向量的平均值来表示实体特征:0我们直接采用在关系识别中学习到的关系嵌入向量作为关系表示。三元组的特征表示如下方程所示:0� � = � ([ � � 1 � � ; � � � � ; � � 2 � � ] + � ) (8)0其中� �,� �表示句子中第i个和第j个实体特征,� � ∈ � � × 1是可训练的关系嵌入矩阵U ∈ � � × � �中的第n个向量,� �是预定义的完整关系集的大小,� � 1,� �,� �2,�是可学习参数,;表示连接,� ()是前馈神经网络。三元组的最终实体角色预测如下方程所示:0� ���� � ( � �,� ) = ������� ( � ���� � � �,� + � ���� � ) (9)0���� � ( � �,� ) = ������ ( � ���� � ( � �,� )) (10)0其中� ���� � ( � �,� )表示在第n个关系下候选三元组的不同语义角色的概率,� ���� �和0� ���� �是可学习参数,���� � ( � �,� )表示数据集中第n个关系下最可能的实体角色。03.5. 损失函数0对于实体提取和关系识别,本文使用了二元交叉熵损失函数,具体方程如下:0� ������ = − 10�0� ∑0� =10� ∈{ �����,��� } � � log � � � + ( 1 − � � ) log ( 1 − � � � ) (11)238 0X. Han and Q.-M. Liu Cognitive Robotics 2 (2022) 234–2410表2数据集统计。Normal,SEO,EPO表示句子中三元组的重叠类型。N表示句子中存在的三元组数量,Relation表示数据集中预定义的关系数量。0数据集 训练 验证 测试0测试集详情0Normal SEO EPO N = 1 N = 2 N = 3 N = 4 N ≥ 5 关系0NYT 56195 4999 5000 3266 1297 978 3244 1045 312 291 108 240WebNLG 5019 500 703 245 457 26 266 171 131 90 45 1710� �������� = − 10�0� =1 � � log � � + ( 1 − � � ) log (1 − � � ) (12)0其中�是样本句子的长度,�����和���表示实体头部和尾部标签,�表示数据集中预定义的关系种类数量。对于实体角色识别,我们使用以下方程中的分类交叉熵损失函数:0� ���� = − 10�0� =1 ,� ≥ � log � ( � �,� = � � ) (13)0其中�是数据集中定义的关系数量,� �是正确的标签。最终损失函数是三者的加权和,具体方程如下:0� ����� = �� ������ + �� �������� + �� ���� (14)0为简单起见,�,�,�均设置为1。04. 实验04.1. 数据集0为了公平地与以前的工作进行比较,我们选择了两个流行的公共数据集NYT [16]和WebNLG[17]。我们还根据重叠类型和三元组数量划分了测试集,然后评估了我们的模型。这两个数据集的具体统计数据如表2所示。我们使用Precision(Prec.)、Recall(Rec.)和F1-score作为我们的评估指标,与基线进行比较。04.2. 实验细节和参数设置0该模型是基于Keras和Tensorflow构建的。我们使用一个预训练的BERT模型(基础版本,使用了一个具有768个隐藏层维度的12层transformer模块)作为编码器。模型的权重是使用Adam[32]优化器进行优化的。学习率设置为1e-5,在NYT和WebNLG数据集上批量大小均为6,最大句子输入长度为100,实体头部和尾部识别以及关系识别的阈值均设置为0.5,实体预测使用接近原则。我们在两个RTX2080Ti上训练了模型,并选择了性能最佳的权重来评估测试集。04.3. 基线0为了公平比较,本文选取以下模型作为基线:(1)NovelTagging [5];(2)CopyRE [6];(3)GraphRel [7];(4)CopyR RL [8];(5)ETL-Span[33];(6)WDec [9];(7)CasRel [11];(8)CGT [10]。所有基线数据均直接来自原始文献。05. 实验结果与分析05.1. 主要结果0表3显示了本模型与两个数据集上基线的实验结果。与CasRel模型相比,我们的模型在NYT数据集上的准确率提高了1.1%,召回率提高了1.4%,F1值提高了1.2%。在WebNLG数据集上,我们的模型召回率提高了1.8%,F1值提高了0.6%。表4显示了我们模型在两个数据集上的实体识别和关系识别性能。我们的模型在WebNLG数据集上表现出更好的实体识别性能,在NYT数据集上表现出更好的关系识别性能。这是由于这两个数据集的大小、实体复杂性和关系定义不同。传统方法在识别实体时通常会手动直接为实体分配语义角色,并且在识别主体和客体时通常是独立进行的,它们首先识别主体,然后将主体与客体结合起来。NYT WebNLG NovelTagging [5] 62.4 31.7 42.0 52.5 19.3 28.3 CopyRE [6] 61.0 56.6 58.7 37.3 36.4 37.1 GraphRel [7] 63.9 60.0 61.9 44.7 41.1 42.9 CopyRE RL [8] 77.9 67.2 72.1 63.3 59.9 61.6 ETL-Span [33] 84.9 72.3 78.1 84.0 91.5 87.6 WDec [9] 94.5 76.2 84.4 - - - CasRel [11] 89.7 89.5 89.6 93,4 90.1 91.8 NYT WebNLG NYT WebNLG 239 0X. Han and Q.-M. Liu 认知机器人学 2(2022)234–2410表3 主要结果,加粗标记为最高分,基线结果数据来自原始文献。0模型0精确率 召回率 F1 精确率 召回率 F10我们 90.8 90.9 90.8 93.0 91.9 92.40表4我们模型在两个数据集上进行实体提取和关系预测两个任务的性能0任务0精确率 召回率 F1 精确率 召回率 F10实体 94.1 96.2 95.1 97.8 98.4 98.10关系 95.8 96.4 96.1 94.8 96.0 95.40表5 计算效率比较。Params all指的是包括编码器-解码器在内的完整模型参数。推理时间(毫秒)指的是模型处理一句话的平均时间。0模型0Params all 推理时间 Params all 推理时间0我们 110,972,419 32.5 111,574,531 30.70特征用于识别对象,但文本中的实体实际上没有语义角色,只有在关系的约束下才具有真正的语义角色,同时,同一实体在不同关系的约束下展现出不同的语义角色,这使得有效识别所有可能的主体和客体变得困难。与这些方法不同的是,我们直接提取所有可能的实体,不再主动为实体分配语义角色,而是在有限数量的关系约束下执行实体语义角色预测,因此在召回率方面取得了更好的性能。句子中的实体和关系需要与句子上下文一起判断,以及句子的语义,然而,当进行实体语义角色预测时,我们并没有引入上下文信息和语义信息,这也导致我们的精确率没有达到预期的结果。05.2. 计算效率分析0为了比较我们的模型和CasRelBERT的计算效率,我们在NYT数据集和WebNLG数据集上进行了实验。实验结果如表5所示,我们的模型在计算效率上具有很强的竞争力。CasRelBERT对于给定句子需要多次解码,导致大量冗余预测。相比之下,我们的模型通过少量关系约束预测实体的语义角色,计算效率更高。为了公平比较,我们选择了批量大小为1时的平均推理时间进行比较。结果表明,我们的模型在性能提升的同时具有更高的计算效率。05.3. 不同句子类型的分析0为了验证我们的模型解决重叠关系抽取的能力,我们还根据重叠类型、三元组数量划分了NYT和WebNLG,并进行了实验验证。实验结果表明,我们的模型可以有效解决重叠关系问题。表6显示了我们的模型在两个数据集中不同句子类型的F1性能。240 0X. Han and Q.-M. Liu 认知机器人学 2 (2022) 234–2410表6 不同三元组重叠类型的句子的F1分数,不同数量三元组的基准结果直接引用自CasRel [11]。0模型0NYT WebNLG0普通 EPO SEO N = 1 N = 2 N = 3 N = 4 N ≥ 5 普通 EPO SEO N = 1 N = 2 N = 3 N = 4 N ≥ 50CopyRE 66.0 48.6 55.0 67.1 58.6 52.0 53.6 30.0 59.2 33.0 36.6 59.2 42.5 31,7 24.2 30.00GraphRel 69.6 51.2 58.2 71.0 61.5 57.4 55.1 41.1 65.8 38.3 40.6 66.0 48.3 37.0 32.1 32.10CasRel 87.3 92.0 91.4 88.2 90.3 91.9 94.2 83.7 89.4 94.7 92.2 89.3 90.8 94.2 92.4 90.00我们的 89.1 93.3 92.6 89.2 90.1 93.0 95.5 89.4 89.6 94.7 92.9 89.5 90.5 94.4 94.1 90.70图2. WebNLG数据集上的错误分布05.4. 错误分析0显然,实体和关系的错误预测以及实体语义角色的错误识别都会影响三元组抽取的性能。为了调查影响三元组抽取性能的因素,我们对WebNLG数据集进行了错误分析。如图2所示,我们将三元组抽取错误分为四类:1)实体错误(包括未找到实体和实体边界错误),2)未找到关系,3)错误1)与错误2)同时发生,4)实体角色识别错误(包括实体角色识别错误和错误判断为实体对不存在关系)。我们发现实体角色识别错误占了最大比例。我们认为主要原因是缺乏实体的上下文信息和语境信息。0结论0在本文中,我们提出了一种基于实体语义角色(主语或宾语)识别的端到端联合关系抽取模型。该模型在少量关系约束下预测实体的语义角色,大大减少了冗余预测,并提高了模型的计算效率。实验结果证明了我们的猜想,即神经网络可以在关系约束下有效预测实体的语义角色。实验结果数据表明,我们的模型在大幅减少冗余预测的同时取得了先进的性能,并具有竞争力。然而,我们的模型也存在一些问题,例如错误累积和缺乏语义和上下文信息。实体识别和关系识别中的错误可能导致构建完整候选三元组时出现性能影响。此外,在关系约束下实体三元组的语义角色识别还需要引入语义和上下文信息来过滤错误的三元组。由于缺乏语义信息,这导致我们的精度未达到预期结果。在未来的工作中,我们考虑改进实体识别模型和关系识别模型,以减少错误累积,并引入更丰富的实体和关系信息,以提高实体角色识别性能。0竞争利益声明0作者声明他们没有已知的竞争性财务利益或可能影响本文工作的个人关系。0参考文献0[1] D. Zelenko, C. Aone, A. Richardella, 关系抽取的核方法, 机器学习杂志. 3 (2003) 1083–1106 . [2] A. Culotta, J. Sorensen, 依存树核方法用于关系抽取, ACL-04第42届年会论文集, 2004 .241 0X. Han and Q.-M. Liu 认知机器人学 2 (2022) 234–2410[3] Y.S. Chan, D. Roth, 利用句法-语义结构进行关系抽取, ACL第49届年会: 人类语言技术论文集, 2011 .0[4] Yu, X. and W. Lam. "通过图模型方法在百科文本中联合识别实体和抽取关系". Coling 2010: Posters. 2010. [5] Zheng, S., et al., "基于新标记方案的实体和关系联合抽取". arXiv预印本arXiv:1706.05075, 2017. [6] X. Zeng, et al., 通过带有复制机制的端到端神经模型提取关系事实, 计算语言学协会第56届年会论文集, 1, 2018 VolumeLong Papers .0[7] T. Fu, P. Li, W.M.A. Graphrel, 用于联合实体和关系抽取的文本建模为关系图, 计算语言学协会第57届年会论文集, 2019 .0[8] X. Zeng, et al., 通过强化学习学习句子中多个关系事实的抽取顺序, 2019年经验方法在自然语言处理会议和第9届国际联合自然语言处理大会论文集 .0[9] T. Nayak, H.T. Ng, 有效建模编码器-解码器架构用于联合实体和关系抽取, AAAI人工智能大会论文集, 2020 .0[10] H. Ye, et al., 通过生成式变换器进行对比三元组抽取, AAAI人工智能大会论文集, 2021 . [11] Z. Wei, et al., 用于关系三元组抽取的新型级联二进制标记框架, 计算语言学协会第58届年会论文集,2020 .0[12] Yuan, Y., et al. "一种关系特定的注意力网络用于联合实体和关系抽取." IJCAI. 2020. [13] K. Zhao, et al., 基于异质图神经网络的迭代融合表示用于联合实体和关系抽取, 知识基础系统. 219 (2021)106888 .0[14] Wang, Y., et al., TPLinker: 通过标记对链接进行实体和关系的单阶段联合抽取. arXiv预印本 arXiv:2010.13415, 2020. [15] Zhong, Z. and D. Chen, "一种令人沮丧的实体和关系抽取方法".arXiv预印本 arXiv:2010.12812, 2020. [16] S. Riedel, L. Yao, A. McCallum, 建模关系及其提及而无标记文本, 欧洲机器学习与数据库知识发现联合会议, Springer, 2010 .0[17] C. Gardent, et al., 创建自然语言生成微规划的训练语料库, 计算语言学协会(ACL)第55届年会 (2017) . [18] M. Mintz, et al., 无标记数据的关系抽取远程监督,ACL第47届年会和AFNLP第4届国际联合自然语言处理大会合并会议论文集, 2009 .0[19] Li, Q. and H. Ji. "实体提及和关系的增量联合抽取". ACL (1). 2014. [20] M. Miwa, Y. Sasaki, 用表格表示进行联合实体和关系抽取, 2014年经验方法在自然语言处理会议论文集, 2014 .0[21] C. Sun等,使用联合最小风险训练提取实体和关系,在:2018年经验方法在自然语言处理会议论文集,2018 .0[22] G. Bekoulis等,作为多头选择问题的联合实体识别和关系提取,Expert Syst. Appl. 114 (2018) 34–45 . [23] S. Wu, Y.He,利用实体信息丰富预训练语言模型进行关系分类,在:第28届ACM国际信息与知识管理会议论文集,2019 .0[24] W C Niu, Q Chen, W Zhang等,GCN2-NAA: 用于联合实体和关系提取的两阶段图卷积网络与节点感知注意力[C],在:2021年第13届国际机器学习与计算会议,2021,pp. 542–549 .0[25] X Li, Y Li, J Yang等,一种关系感知嵌入机制用于关系提取[J],Appl. Intell. (2022) 1–10 . [26] Luo X, Liu W, Ma M等,BiTT:用于联合提取重叠实体和关系的双向树标记[J],arXiv预印本arXiv:2008.13339,2020 . [27] L Wang, C Xiong, N.Deng,基于多目标依赖性的重叠关系提取研究[C],在:2020年第15届国际计算机科学与教育会议(ICCSE),IEEE,2020,pp. 618–622 .0[28] Y Chen, Y Zhang, C Hu等,利用推理模式增强的二进制指针网络联合提取显式和隐式关系三元组[C],在:2021北美计算语言学协会年会论文集:人类语言技术,2021,pp. 5694–5703 .0[29] D. Zeng, H. Zhang, Q. Liu,Copymtl: 用于联合提取实体和关系的复制机制多任务学习,在:AAAI人工智能会议论文集,2020 .0[30] C Bai, L Pan, S Luo等,一种带有双指针模块的新型端到端模型联合提取实体和关系[J],Neurocomputing 377 (2020) 325–333 .0[31] Devlin, J.等,"Bert: 用于语言理解的深度双向变压器的预训练",arXiv预印本arXiv:1810.04805,2018 . [32] Kingma, D.P.和J. Ba,"Adam:一种用于随机优化的方法",arXiv预印本arXiv:1412.6980,2014 . [33] Yu, B.等,"基于新型分解策略的实体和关系联合提取",arXiv预印本arXiv:1909.04273,2020 .
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Android圆角进度条控件的设计与应用
- mui框架实现带侧边栏的响应式布局
- Android仿知乎横线直线进度条实现教程
- SSM选课系统实现:Spring+SpringMVC+MyBatis源码剖析
- 使用JavaScript开发的流星待办事项应用
- Google Code Jam 2015竞赛回顾与Java编程实践
- Angular 2与NW.js集成:通过Webpack和Gulp构建环境详解
- OneDayTripPlanner:数字化城市旅游活动规划助手
- TinySTM 轻量级原子操作库的详细介绍与安装指南
- 模拟PHP序列化:JavaScript实现序列化与反序列化技术
- ***进销存系统全面功能介绍与开发指南
- 掌握Clojure命名空间的正确重新加载技巧
- 免费获取VMD模态分解Matlab源代码与案例数据
- BuglyEasyToUnity最新更新优化:简化Unity开发者接入流程
- Android学生俱乐部项目任务2解析与实践
- 掌握Elixir语言构建高效分布式网络爬虫
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功