AI前沿论文最新进展：语音合成和情感识别领域的突破

需积分: 0 131 浏览量更新于2024-06-30 收藏 1.03MB PDF 举报

AI 前沿论文最新进展本资源摘要信息涵盖了三篇 AI 前沿论文的最新进展，分别是 WaveGlow：一种基于流的语音合成生成网络、复杂情感识别的深层网络特征和使用整数线性规划生成文本。 1. WaveGlow：一种基于流的语音合成生成网络 WaveGlow 是一种基于流的语音合成生成网络，能够从 mel 图谱生成高质量的语音。WaveGlow 结合了光晕和 WaveNet 的见解，以提供快速、高效和高质量的语音合成，而无需自动回归。WaveGlow 仅使用单个网络进行实现，仅使用单个成本函数进行培训：最大限度地提高培训数据的可能性，使培训过程简单而稳定。PyTorch 实现了 NVIDIA V100 GPU 上超过 500 kHz 的速率产生成语音频采样。平均的意见得分表明，它提供的语音质量和最好的公开可用的 WaveNet 实现一样好。所有代码将在网上公开提供。 2. 复杂情感识别的深层网络特征本论文研究了不同的声学特征、基于语音事件的特征和基于语音的自动翻译的词汇特征在复杂情感识别中的影响，如好奇心。预先培训网络，即 AudioSet 网络、VoxCeleb 网络和深度语音网络针对不同的语音应用进行了广泛的培训。这些网络的深层信息被视为描述符，并被编码成特征向量。对由 8 个复杂情感组成的 EmoReact 数据集的实验结果表明了其有效性，在文献中对 0.69 的基线产生了最高的 F1 分数 0.85。 3. 使用整数线性规划生成文本概念到文本生成通常采用管道体系结构，通常会导入大量的参数和计算资源。为了解决这个问题，本论文提出了使用整数线性规划生成文本的方法。这种方法可以减少参数的数量和计算资源的占用，从而提高文本生成的效率和质量。这三篇论文都展示了 AI 领域的最新进展和技术创新，涵盖了语音合成、情感识别和文本生成等方面，展示了 AI 在这些领域的应用前景和发展趋势。

[27] arXiv: 1811.00135 [pdf,

其他

]

󰉁于本建模的󰙵动编码变分

宜君县

天成赵

威廉杨王

主题

计算和语󰤛

(cs

。

CL);

智能

(cs

。

AI);

机学习

(cs

。

LG);

神经和进化计算

(cs. NE)

本介绍种改进的变分󰙵动编码

(VAE)

的本建模

并将主题信息显式

地建模为个正则变󰮢。通过提供建议的模型主题意识

在重构输本󰴯具

有󰷼的优越性。此外

由于新引的变󰮢和传统的多变󰮢󰷼斯变󰮢之间的内在

相互作󰉁

该模型太容出现

发散消失。推导新模型的变分下限

并对

四种同的数据集进󰢩实验。结果表明

所提出的模型在空间的本重构上具

有较󰷼的优越性

对学习表示的分类具有󰷼的测试精度。

[28] arXiv: 1811.00139 [pdf, ps,

其他

]

在旋转变分布上测试

Halfspaces

纳撒尼尔伤害

: 36

󰵎

, 2

数字

出现在苏打

2019

主题

数据结构和算法

(cs

。

DS);

机学习

(cs

。

我们提出种在任意未知旋转变分布上测试

halfspaces

的算法。使󰉁

O#(n‾√ϵ

−7

)

未知函数的随机示

该算法确定󰷼概率是否

的

形式

F(X)=s

我

gn(∑

我

−t)

或者是

远离所有

这些功能。此样本明显于已知要求的

Ω(n)

学习

halfspaces

和已知下

限的样本意味着我们的样本是最佳的

(

在其依赖

)

到对数系数。该算法是

分布的

因为它需要知识的分布

除承诺的旋转变性。为证明该算法

的正确性

我们提出个关于函数与半空间之间距离的定󰇹

它适󰉁于任意

分布。

[29] arXiv: 1811.00142 [pdf,

其他

]

通过󰕲络资源的优化多样化提󰷼

ICS

的󰕲络恢

复能

婷婷

诚丰

克󰮟斯汉󰮣

主题

密码学和安全性

(cs

。

CR)

󰕲络多样性已被泛认为是有效的防御策󰉝

以减少恶意软件的传播。优化󰕲络

资源的多样化可以提󰷼󰕲络抵御恶意软件传播的能。在使󰉁现代

基础设施

升级旧式业控制系统的背景下

这项作提出种有效的法来计算这种

最佳部署。我们的法可以在搜索最优多样化

(

如过时的产品和严格的配置策󰉝

)

时容忍各种限制因素。我们明确地测󰮢基于

CVE/NVD

的产品的󰂬相似性

估计产品间恶意软件的感染率。个超级启发的案展示我们在实践中的

最佳多样化

尤其是在受各种需求约束的情况下。然后

我们根据定义明确的多

样性指标和平均时间折衷

(

培训中

)

来衡󰮢多样化󰕲络的改进韧性

以验证我

们法的有效性。进步评价影响优化性能的三因素

如󰕲络结构、产品种类

和约束条件等。最后

我们展示我们的法在秒钟到分钟内为规模󰕲络

(

多达

万台主机

)

和󰷼密度

(

最多

万个边缘

)

寻找最佳解决案的竞争性可

扩展性。

[30] arXiv: 1811.00143 [pdf,

其他

]

主化󰈿产规模分布式深度学习

茗皇󰶹

哈迪倒克

尼尔

吉顺兰卡威阿迪雅

圣地亚哥

Akle,

秦



Gimni cher,

多󰒣尼克

沃尔

主题

计算机视觉和模式识别

(cs

。

CV);

分布式、并󰢩和集群计算

(cs

。

DC);

机学习

(cs

。

深度神经󰕲络培训的兴趣和需求直在迅速增󰲊

跨越学术界和业界的泛

应󰉁范围。然󰖳

由于所涉及的具和硬件的复杂󰈿态系统

它们的分布和规模

培训仍然很困难。个结果是

编排这些复杂组件的责任通常󰉙给次性脚本和

针对特定问题定制的胶代码。为解决这些限制

我们引公众

{

炼󰮣术



在

Apple

基础上构建的内部服务

公众

{



}

、

公众

{fast}

和

公众

{

可

扩展

}

分布式培训。我们将讨论它的设计、实现和运󰢩同类型的分布式培训的

示。我们还在开发󰙵主系统的过程中引案研究

其中培训时间减少

10x,

以跟上断增󰲊的数据收集。

[31] arXiv: 1811.00145 [pdf, ps,

其他

]

通过稀有事件仿真实现可扩展的端到端󰙵主󰪄辆

测试

󰶹修

O '

凯

安

Sinha, Hongseok Namkoong,

约翰迪杜󰻗

罗斯

Tedrake

:NIPS 2018

主题

机学习

(cs

。

LG) ;

机

(cs);

机学习

(

统计

ML)

虽然󰙵主󰪄辆

(AV)

技术的最新发展突出重进展

但我们缺乏严格和可扩

展测试的具。现实世界的测试

事实上

评估环境

使公众处于危险之中

由于事故的罕󰤁性质

将需要数以亿计的󰮟程来统计验证绩效索赔。我们实施

个模拟框架

可以测试整个现代󰙵主驾驶系统

特别是使󰉁深度学习感知和

控制算法的系统。󰉁󰙵适应重要性抽样法加速稀有事件概率评估

估计基

于标准交通󰢩为的基础分布下的事故概率。我们在󰷼速公󰩁上展示我们的框架

加速系统评估

时间过天真的蒙特卡抽样法和

300 𝖯

次

(

其中

𝖯

是处󰇹的数󰮢

)

在实际测试。

[32] arXiv: 1811.00146 [pdf,

其他

]

原

机常识的地图集如果

然后推󰇹

󰶹丁

Sap,

罗南

LeBras,

艾󰒣莉阿拉󰵄

钱德拉

Bhagavatula,

尼古拉斯劳

󰮟

汉娜

Rashkin,

布兰登屋顶

诺亚

史密斯

冶󰮣崔

接受

AAAI 2019;9

󰵎

, 3

数字

主题

计算和语󰤛

(cs

。

CL)

我们提出原

个常常识推󰇹的图谱

通过

300k

本描述组织。与以分

类知识为中的现有资源相

原集中于推󰇹知识组织成类型

if-

然后与变󰮢

的关系

(

如

, "

如果

付你的恭维

那么

可能会返回恭维

。我们建议九

个

if-

然后关系类型来区分原因

v.s.

效应

代󰇹

v.s.

主题

󰙵愿

v.s.

󰴬󰙵愿

事件

和󰢩动

v.s.

精神状态。通过对原中所描述的丰富推断知识的冥思苦想

训练

我们发现神经模型可以获得简单的常识能和关于以前看到的事件的

原因。实验结果表明

多任务模型结合

if-

然后关系类型的层次结构

可导致

准确的推断

与独󰐩训练的模型相

这是由󰙵动和评估所测󰮢的。

[33] arXiv: 1811.00147 [pdf,

其他

]

多󰴏斯

深层情境知识图嵌

浩宇王

维󰵄克阿图尔

库尔卡尼

威廉杨王

: 10

󰵎

, 6

数字

主题

计算和语󰤛

(cs

。

CL);

智能

(cs

。

AI);

机学习

(cs

。

LG);

神经和进化计算

(cs. NE)

我们介绍种󰉁于学习知识图嵌的新法

有效地捕获实体和关系之间

的上下线索和依赖关系。󰶳先

我们注意到

包含实体链和关系的知识图的短

󰩁径可以编码有关其上下󰉁法的有价值的信息。我们通过将知识图表示为三元

组的集合

󰖳是作为实体关系链的集合来实现这概念

并使󰉁捕获此类上

下󰉁法的深层神经模型学习实体和关系的嵌。特别是

我们的模型基于双向

LSTMs,

并从构造的实体关系链中学习实体和关系的深层表示。我们表明

这些

表述可以很容地纳现有模型中

从󰖳显著提升个知识图预测任务

(

如

链󰩁预测、三重分类和缺失关系类型预测

)

的技术状态

(

在某些情况下󰙸少

9.5%)

。

[34] arXiv: 1811.00148 [pdf,

其他

]

有限观测的次张󰮢的恢复保证

红阳

领夏朗

摩󰣽恰󰮟卡尔

盈余

主题

机学习

(cs

。

LG) ;

数据结构和算法

(cs

。

DS);

机学习

(

统计

ML)

剩余62页未读，继续阅读

张博士-体态康复

粉丝: 36

AI前沿论文最新进展：语音合成和情感识别领域的突破

AI前沿论文最新进展 2018.11.01 方建勇1

AI前沿论文最新进展 2018.10.29 方建勇1

AI与计算机前沿论文最新进展 2018.11.07 方建勇1

2016年以来AI电网前沿论文最新进展 2018.11.03 方建勇1

一年来智能医疗前沿论文最新进展 2018.11.04 方建勇1

超精度研究前沿论文最新进展 2018.11.06 方建勇1

一年来Facebook前沿论文最新进展 2018.11.04 方建勇1

一年来微软专题前沿论文最新进展 2018.11.05 方建勇1

人脸检测一年来前沿论文最新进展 2018.11.06 方建勇1

2018年以来自然语言处理前沿论文最新进展 2018.11.03 方建勇1

最新资源