2018年自然语言处理最新进展：从多模态理解到可解释性框架

需积分: 0 84 浏览量更新于2024-06-30 收藏 2.49MB PDF 举报

本文主要梳理了2018年自然语言处理领域的几篇重要论文，涉及多模态语言理解、图像字幕引导的序列模型、语言模型的学习动态以及可解释的NLP技术。 1. 论文《How2:Hop:一个用于多模态语言理解的大规模数据集》(How2: Hop - A Large-Scale Dataset for Multimodal Language Understanding) 这篇论文提出了名为"How2"的数据集，它包含多模态的教学视频，配有英文字幕和众包的葡萄牙语翻译。How2旨在推动多模态自然语言处理的研究，提供了机器翻译、自动语音识别、口译和多模态摘要的综合序列到序列基准。通过这种方式，该数据集有望帮助研究人员深入理解多模态在语言处理中的作用。 2. 论文《一种注重图像字幕的顺序引导网络》(Order-Guided Network for Image Captioning) 该研究关注计算机视觉和深度学习在图像字幕生成上的应用。论文提出了一种新的顺序引导网络，以提高图像描述的生成质量。这种方法可能有助于模型更好地理解图像内容并生成准确的描述。 3. 论文《使用SVCCA理解语言模型的学习动态》(Understanding Learning Dynamics of Language Models with SVCCA) 研究人员使用SVCCA（ Singular Vector Canonical Correlation Analysis，奇异向量Canonical相关分析）来探究神经语言模型如何在训练过程中隐式地编码语言结构。他们发现语言模型的各层递归神经网络在不同的阶段学习语言结构，如对语法的部分学习早于对语义和主题信息的学习。 4. 论文《实现可探索的NLP：文本分类的生成解释框架》(Towards Explorable NLP: A Generative Explanation Framework for Text Classification) 这篇文章关注的是构建可解释的自然语言处理系统，特别是针对文本分类任务。作者提出了一种生成解释框架，旨在帮助用户理解模型决策背后的逻辑，提高NLP系统的透明度和可信任度。这些论文共同展示了2018年自然语言处理领域的热点和发展趋势，包括多模态理解、模型解释性以及深度学习在语言模型训练中的应用。这些研究成果不仅深化了我们对自然语言处理的理解，也为未来的研究和应用开辟了新的路径。

bert:

󰉁于语󰤛󰇹解的深双向变压的预培训

作者

:jacob devlin,

张明伟

, k

据说

lee , kolina Toutanova

摘

我们引种新的语󰤛表示模型

称为

bert,

它代表来󰙵变压的双向编码

表示。与最近的语󰤛表示模型同

, bert

设计󰉁于通过在所有图层的左右上下上

共同调节来预训练深双向表示。因此

可以使󰉁个额外的输出图层对预先培训的

bert

表示进󰢩微调

以为各种任务

(

如问题回答和语󰤛推断

)

创建最先进的模型

󰖳需󰮢内容特定于任务的体系结构修改。

bert

在概念上很简单

经验也很强。

它在

项󰙵然语󰤛处󰇹任务上获得新的最先进的结果

包括将

glue

基准提󰷼到

80.4 (

绝对提󰷼

7.6%)

、多

nli

精度提󰷼到

18.7 (

绝对提󰷼

5.6%)

和

squad v1.1

回答

测试

到

93.2 (1.5%

的绝对改善

类的表现󰷼出

2.0%

。少

2018





提交

;

最初宣布

2018



。

:13

󰵎

48.

第

1810.04700[pdf,

其他

] Cs

。

数据到本󰈿成的端到端内容和计划选择

作者

:sebastian gehrmann, falcon z. dai , henry elder,

亚历

拉

摘要

学习󰉁神经󰕲络从结构化数据中󰈿成流畅的󰙵然语󰤛已成为

nlg

的常󰉁法。

当结构化数据的形式在同的示中发󰈿变化时

此问题可能具有挑战性。本对序

到序模型的个扩展进󰢩综述

以考虑潜在的内容选择过程

特别是复制注意和

覆盖解码的变体。我们进步提出种基于同组合的训练法

以󰻊励模型在训练

过程中学习同的模板。对这些技术的实证评价显示

在五个󰙵动化指标以及

评估中󰈿成的本的质󰮢有所提󰷼。少

2018





提交

;

最初宣布

2018



。

:inlg 2018

49.

建议

: 1810.04440[pdf] Cs

。

研究

bhartrhari

的新

vista:

认知

nlp

作者

:jyashree gajjam, Diptesh kanojia, malhar kulkarni

摘要

梵语语法传统主要从帕尼尼的阿斯塔希亚伊开始

以帕达萨斯特拉的身份

最终

成为个位于

bhartrhari

中的瓦基萨索斯特拉。󰙵

ashok aklujkar

在哈佛学提交

博论以来

语法哲学家

bhartrhari

和他的权威著作

"vakyapadiya"

󰙸少

多

来直是现代学者研究的问题。和单词作为语󰤛中个有意义的语󰤛单位的概念

直是后来许多作品讨论的主题。虽然些学者运󰉁语󰤛学技术批判地建󰐩

bhartrhari

作品的本

但也有些学者致于从这些技巧中探索哲学󰤁解。还有些

从现代语󰤛学和󰇹学的󰤐度对他的作品进󰢩研究。很少有试图通过逻辑讨论

来证明这些观点是合󰇹的。在本中

我们提出个新的观点

研究

bhartrhari,

和

他的作品

特别是

瓦卡帕迪亚

。这种观点是从󰙵然语󰤛处󰇹

(nlp)

领域

具体地

说

么被称为认知

nlp

。我们研究

bhartrhari

在

"vakyapadiya"

第章开头给出

的的定义。我们研究其中的个定义

进󰢩实验

并遵循沉默阅读梵段落

的法。我们收集参与者的

gaze

󰢩为数据并对其进󰢩分析

以解类头脑中的基

本󰇹解过程

并展示我们的结果。我们使󰉁

检验来评估我们的结果的统计意义

并

讨论我们作的注意事项。我们还对这实验和这种法的有󰉁性提出些般性

意󰤁

以在

bhartrhari

的作中获得多的󰤁解。少

2018





提交

;

最初宣布

2018



。

:19

󰵎

50.

建议

: 1810.04437[pdf,

其他

] Cs

。

坚持是有回报的

关注

lstm

的起动机制所存在的问题

作者

:giancarlo d. salton , john d. kelleher

摘要

使󰉁语󰤛模型

(lm)

是种󰙵然语󰤛处󰇹系统中的重要组成部分。由

lstm

单元

组成的复发性神经󰕲络

lm,

特别是那些增强外部存储的单元

取得最先进的结果。

然󰖳

由于信息衰落和对最新信息的偏󰤁

这些模型仍然难以处󰇹有可能包含远程

依赖关系的󰲊序。本根据

lstm

󰲋控机制持久化信息的时间数

在对内存中信息进

󰢩处󰇹的基础上

演示种在内存增强型

lstm lm

中检索信息的有效机制。少

2018





提交

;

最初宣布

2018



。

51.

第

1810.0101[pdf,

其他

] Cs

。简历

作为

sockeye

神经机翻译任务的图像字幕

作者

:loris bazzani, tobias domhan, felix hieber

摘要

图像字幕是个介于计算机视觉和󰙵然语󰤛处󰇹之间的跨学科研究问题。任务是

󰈿成图像内容的本描述。图像字幕的典型模型是编码解码深层󰕲络

编码捕获

图像的本质

󰖳解码负责󰈿成描述图像的。注意机制可以󰉁来󰙵动将解码集中

在与预测下个单词有关的图像部分。本探讨神经机翻译中常󰉁的同解码

和注意模型

即注意递归神经󰕲络、󰙵注意变压和完全卷积󰕲络

它们代表神经

机翻译的当前状态。神经机翻译的艺术。图像字幕模块可作为

sockeye

的部分

在

https://github.com/awslabs/sockeye

可以在

https://awslabs.github.io/sockeye/image_captioning.html

找到教程。少

2018





提交

;v1

于

2018





提交

;

最初宣布

2018



。

52.

第

: 1810.03996[pdf, ps,

其他

] Cs

。

基于序神经󰕲络的学习名词案

作者

新浪艾哈迈迪

摘要

形态衰退是󰙵然语󰤛处󰇹中的项重要任务

其󰋴的是反映名词的数󰮢、案和

性别。本研究提案旨在解决递归神经󰕲络

(rnn)

在多程度上能够有效地学习减少名

词的情况。考虑到数据稀疏在处󰇹形态丰富的语󰤛󰴯的挑战

以及这些语󰤛中结

构的灵活性

我们相信

建模形态依赖关系可以改善神经󰕲络模型的性能。建议进󰢩各

种实验

以解可解释的特征

从󰖳好地推跨语󰤛任务中的学习模型。少

2018





提交

;

最初宣布

2018



。

󰵎研究建议

53.

第

: 1810.03993[pdf,

其他

] Cs

。

模型报告的模型卡

作者

:margaret mitchell, simone wu, andrew zaldivar, parker barnes, lucy

vasserman, ben hutchinson, elena spitzer, inioluwa deborah raji, timnit ge

兄弟

摘要

受过训练的机学习模式越来越多地󰉁于在执法、医学、教育和就业等领域执󰢩

影响的任务。为阐明机学习模型的预期󰉁

并最限度地减少它们在太适合

的上下中的使󰉁

我们建议在发布的模型中附上详细说明其性能特征的档。在本

中

我们提出个我们称之为模型卡的框架

以󰻊励这种透明的模型报告。模型卡是

附带训练有素的机学习模型的简短档

可在各种条件下提供基准评估

如跨

同的化、或表型组

(

如种族、地󰇹位置、性别、与预期应󰉁领域相关的菲茨帕

特󰮟克󰋝肤类型

)

和交叉组

(

如

龄和种族

或性别和菲茨帕特󰮟克󰋝肤类型

)

。模

型卡还披󰴣打算使󰉁模型的背景、业绩评价程序的细节以及其他相关信息。虽然我

们主要关注计算机视觉和󰙵然语󰤛处󰇹应󰉁领域中以为本的机学习模型

但这个

框架可以󰉁来记录任何训练有素的机学习模型。为巩固这概念

我们为两个受监

督的模型提供卡󰅧

个是检测图像中笑脸的培训

另个是检测本中有毒评论的

培训。我们建议使󰉁模型卡

作为实现机学习和相关

技术负责任主化的个步

骤

提󰷼智能技术运作情况的透明度。我们希望这项作󰻊励那些发布训练有素的

机学习模型的在模型发布的同时提供类似的详细评估数字和其他相关档。少

2018





提交

;

最初宣布

2018



。

54.

第

: 1810.03918[pdf,

其他

] Cs

。红外

󰉁结构特征和依赖原则在答题中提取答案

作者

:lokesh kumar sharma, namita mittal

摘要

问答

(qa)

研究是󰙵然语󰤛处󰇹中项具有重要挑战性的课题。

旨在从相关

本󰅧段或档中提取准确答案。

研究背后的动机是使󰉁最先进搜索引擎的󰉁户的

需求。󰉁户需要的是准确的答案

󰖳是可能包含答案的档表。本从相关献中

提取出成功的答案

需要个有效的特点和关系来提取。这些特征包括各种词汇、法、

语义和结构特征。建议的结构特征是从问题和持的档的依赖特征中提取出来的。

实验结果表明

结合基本特征

󰉁依赖原则设计

结构特征提󰷼答案提取的准确

性。提出的结构特点采󰉁新的设计原则来提取远程关系。这增加是整体答案提取

精度提󰷼的个可能原因。少

2018





提交

;

最初宣布

2018



。

:12

󰵎

, 11

个图

, 6

个表

, 4

算法和

ieee

格式

55.

建议

: 1810.03552[pdf,

其他

] Cs

。

零资源多语󰤛模式转移

学习共享内容

作者

:xilun chen, ahmed hassan awadallah, hani hassan, wei wang, claire cardie

摘要

󰉁神经󰕲络模型

现代󰙵然语󰤛处󰇹和󰇹解应󰉁得到极的提升。然󰖳

对

于多数语󰤛

特别是没有󰨤够的附加说明的培训数据的资源󰨤的语󰤛来说

情况

并󰴬如此。跨语󰤛迁移学习法通过󰉁来󰙵其他

(

源

)

语󰤛的标记数据

(

通常借助并󰢩

语库等跨语󰤛资源

)

来提󰷼低资源󰋴标语󰤛的性能。在这项作中

我们提出第

个零资源多语󰤛传输学习模型

它可以󰉁多种源语󰤛的培训数据

同时需要󰋴标

语󰤛培训数据

也需要跨语󰤛监督。与现有的仅依赖于语󰤛变特征进󰢩跨语󰤛传输

的法同

我们的法以致的式󰉁语󰤛变和特定于语󰤛的特征。我们的模型

󰉁对抗󰕲络来学习语󰤛变的特征和专家混合模型

动态地󰉁󰋴标语󰤛和每个单

独源语󰤛之间的关系。这使我们的模型能够有效地解在多语󰤛设置中在各种语󰤛之

间共享的内容。与现有技术相

它显著提󰷼性能

如在多本分类和序标记任务

(

包括型实际󰢩业数据集

)

上进󰢩的系泛实验中所示。少

2018





提交

;

最初宣布

2018



。

56.

建议

: 1810.03445[pdf] Cs

。

基于词向󰮢组合模型的语󰤛进化树的构建

作者

朱󰷼

姜艳辉

󰷼俊辉

摘

本试图通过案计算来探讨语󰤛的演变。󰶳先

我们选择

1400

󰙸

2005



位英国作家的说

找到相应的作品

;

然后

󰉁󰙵然语󰤛处󰇹具构造相应的

个语库

计算

个语库中

100

个󰷼频词的相应词向󰮢

;

接下来

对于每个语库

我们将

100

个单词向󰮢从开始到结束连接为个

;

最后

󰉁相似性较和分层聚类

法󰈿成组合的

个词向󰮢之间的关系树。这棵树代表个语库之间的关系。

我们发现

在聚类󰈿成的树中

语库与与语库相对应的份之间的距离基本相同。

这意味着我们发现个特定的语󰤛进化树。为验证这种法的稳定性和多功能性

我们增加另外三个主题

狄斯的部作品、

世纪诗的作品和近

6 0

来的艺

术批评。对于这四个主题

我们测试同的参数

如语库的时间跨度、语库之间

的时间间隔、词向󰮢的维度以及󰷼频公共词的数󰮢。结果表明

该法相当稳定

󰉁途

泛。少

2018





提交

;

最初宣布

2018



。

57.

建议

: 1810.03430[pdf] Cs

。红外

来󰙵维基百科的交叉脚本印地语英语

ner

语库

作者

:mohd zeeshan ansari, tanvir ahmad, md Ansari ali

摘要

社交媒体平台上󰈿成的本本质上是混合的语󰤛本。任何形式的语󰤛混合都会

给语󰤛处󰇹系统带来相当的困难。此外

语󰤛处󰇹研究的进步取决于标准语库的可

󰉁性。混合语󰤛的印度命名实体识别

(ner)

系统的开发正󰴯临着障碍

因为没有标准的

评价公司。这种语库可能是混合的语󰤛性质

其中本是使󰉁多种语󰤛编写的

主要

是使󰉁单个脚本。我们作的动机是强调这种公司的󰙵动󰈿成

以󰻊励混合语󰤛的印度

ner

。本介绍维基百科类别󰵎󰴯中的交叉脚本

hindi-nh

语库的编写过程。使󰉁

标准的

conll-2003

类别的

per

、

loc

、

org

和

misc

对该公司进󰢩成功的注释。对各

种机学习算法进󰢩评价

取得良好的效果。少

2018





提交

;

最初宣布

2018



。

智能数据通信技术与物联󰕲国际会议

(icici-2018)

58.

建议

: 1810.02100[pdf,

其他

] Cs

。

域外依赖关系分析的半监督法

作者

于俊涛

摘要

依赖关系分析是将法树分配给本的重要󰙵然语󰤛处󰇹任务之。由于依赖语

库的泛可󰉁性以及改进的解析和机学习技术

基于监督学习的系统的解析精

度得到显著提󰷼。然󰖳

由于监督学习的性质

这些解析系统󰷼度依赖于动注释的

培训语库。它们在域内数据上的作效果相当好

但在域外本上测试时

性能显著

下降。为弥补域内和域外的性能差距

本研究三种域外依赖关系分析的半监督技

术

即共同训练、󰙵我训练和依赖关系语󰤛模型。我们的法使󰉁于获得的未标记数

据来提󰷼域外解析精度

󰖳需昂贵的语库注释。对个英语领域和多语󰤛数据的评

价表明

在解析精度󰴯有相当好的提󰷼。总体󰖳󰤛

这项作对域外依赖关系分析

的半监督法进󰢩调查

在统的框架中

我扩展并较些重要的半监督法。

这些技术之间的较表明

󰙵我训练与领域外解析的共同训练同样有效

󰖳依赖语模

型可以提󰷼域内和域外的准确性。少

2018





提交

;

最初宣布

2018



。

博论

59.

第

1810.01570[pdf,

其他

] Cs

。

种󰉁于患者笔记的深层学习体系

实现与评价

作者

:kaung khin, phip burckhardt, rema padman

摘要

除身份识别是将

种受保护的健康信息

(phi)

从临床笔记中删除的过程

以

将本视为法单独识别。󰙵然语󰤛处󰇹

(nlp)

的最新进展使得能够使󰉁深度学习技术

来完成去识别任务。在本中

我们提出个深的学习架构

它建󰐩在最新的

nlp

进步的基础上

结合深刻的上下化嵌和变分退出双

lstm

。我们在两个󰮣标准数

据集上测试此体系结构

并表明该体系结构在这两个数据集上实现最先进的性能

同时也其他系统收敛得快

󰖳使󰉁字典或其他知识源。少

2018





提交

;

最初宣布

2018



。

提交第

届信息技术和系统讲习班

60.

建议

: 1810.01466[pdf,

其他

] si

开放源俄罗斯推特数据的监督机学习揭示全球范围和运营特征

作者

克󰮟斯托弗

格󰮟芬

布󰴏迪

克尔

摘要

我们开发并使󰉁系统计法

(

监督的机学习

从推特提供的数据

集中提取相关信息

这些数据集由据称试图影响

2016

美国总统的俄罗斯推󰪄组成

选举。这些监督的统计法可以快速识别

(



)

巨魔中的新兴语󰤛社区

; (



)

作业的跨国范围和

(

三

)

可󰉁于以下󰋴的的巨魔的业务特点

将来的识别。通过󰙵然语󰤛

处󰇹、多种学习和傅󰐩叶分析

我们确定个仅包括

2016

美国选

还包括法

国国家和地及全国德国选举的󰢩动。我们展示由此产󰈿的巨魔群体是由具有共同

但明确定制的󰢩为特征的󰉁户组成的。少

2018





提交

;

最初宣布

2018



。

:19

󰵎

, 14

数字

61.

建议

: 1810.01127[pdf] Cs

。艾

神经系统中的预测学习

发现潜在的󰈿成结构

作者

:andrea e. martin, leonidas a. a. doumas

摘要

类从他们的环境中学习复杂的潜在结构

(

如

󰙵然语󰤛、数学、󰵋乐、社会

等级

)

。在认知科学和认知神经科学中

从感官或阶表示中推断󰷼阶结构的模型被提

出来解释类󰢩为的复杂性和灵活性。但这些模型调󰉁的结构是如何在󰶳先出现在神

经系统中的呢？为回答这个问题

我们解释系统如何从完全󰴬结构化数据的经验

中学习潜在的表示结构

(

即谓词

)

。在谓词学习的过程中

神经󰕲络󰉁跨神经元程

序集的分布式计算的󰙵然动态特性来学习谓词

同时也将它们结合起来从概念上讲

两个计算󰴯似乎是必要的类󰢩为

根据形式󰇹论在多个领域。我们描述如何使󰉁

神经振荡将谓词推到神经󰕲络中

以实现类似类的外推和组合。从经验中学习

谓词、从组合上表示结构以及推断看󰤁的数据的能为󰇹解和建模最复杂的类󰢩

为提供条前进的道󰩁。少

2018





提交

;

最初宣布

2018



。

62.

第

: 1810.00664[pdf, ps,

其他

] Cs

。

向󰮢空间模型中的本相似性

个较研究

作者

:omid shahmirzadi, adam Lugowski, kenneth younge

剩余166页未读，继续阅读

萌新小白爱学习

粉丝: 25
资源: 311

2018年自然语言处理最新进展：从多模态理解到可解释性框架

AI前沿论文最新进展 2018.10.30 方建勇1

AI前沿论文最新进展 2018.11.02 方建勇1

AI前沿论文最新进展 2018.11.01 方建勇1

2018年以来开源项目前沿论文最新进展 2018.11.06 方建勇1

自2016年以来基于Matlab的前沿论文最新进展 2018.11.03 方建勇1

2016年以来AI电网前沿论文最新进展 2018.11.03 方建勇1

一年来iot前沿论文最新进展 2018.11.03 方建勇1

2018年6月以来智能交通前沿论文最新进展 2018.11.04 方建勇1

一年来目标检测前沿论文最新进展 2018.11.03 方建勇1

自2016年以来自动驾驶前沿论文最新进展 2018.11.03 方建勇，王战古1

最新资源