循环神经网络：记忆序列数据的力量

需积分: 10 89 浏览量更新于2024-07-18 收藏 1.4MB PDF 举报

循环神经网络综述循环神经网络(CNN)是一种革命性的深度学习模型，特别适用于处理序列数据，如语音识别、自然语言处理等场景，它引入了记忆机制，使得网络能够捕捉并利用输入序列中的长期依赖关系。相比于全连接网络和卷积网络，它们不具备记忆能力，只能对独立输入进行处理。在序列预测问题中，如汉语填空或预测时间序列，比如预测一个人说话语音或下一个词，RNN至关重要。 RNN的核心在于循环层，其工作原理基于状态更新。每个时间步t，RNN会保留上一时刻ht的状态，并将其与当前输入xt结合，通过激活函数f计算新的状态值，形成递推关系式： \[ h_t = f(h_{t-1}, x_t) \] 这种递归结构允许网络记住先前的信息，这对于理解上下文、依赖关系和生成连续的输出至关重要。RNN最初在1990年代由琼斯等人提出，但真正引起广泛关注是在Hochreiter和Schmidhuber的长短期记忆(LSTM)和门控循环单元(GRU)的提出后，这些改进解决了传统RNN的梯度消失和爆炸问题，使得模型训练更加稳定。在语音识别中，RNN被用于声学模型，捕捉语音信号随时间演变的特性；在自然语言处理领域，RNN广泛应用于文本分类、机器翻译、情感分析等任务，它们能捕捉到单词之间的语法和语义关系。此外，RNN也被应用在音乐生成、推荐系统甚至生物信息学中，如蛋白质结构预测。然而，尽管RNN表现出色，它们仍然存在一些局限性，如对于长序列的记忆衰减问题，以及训练过程中的计算复杂度较高。随着Transformer等新型架构的出现，虽然RNN仍然是序列建模的重要组成部分，但研究人员正在寻找更加高效且能处理更长序列的替代方案。总结来说，循环神经网络作为深度学习中不可或缺的一部分，其记忆能力和对序列数据的处理能力使其在许多领域取得了显著成就，但也面临着持续的优化和发展挑战。

CTC

循环神经网络虽然可以解决序列数据的预测问题，但它要求输入的数据是每个时刻分割

好并且计算得到的固定长度的特征向量。对于有些问题，对原始的序列数据进行分割并计算

特征向量存在困难，典型的是语音识别。原始的声音信号我们很难先进行准确的分割，得到

每个发音单元所对应的准确的时间区间。解决这类问题的一种典型方法是 CTC 技术。

CTC[13]是一种解决从未分段的序列数据预测标签值的通用方法，在这里不要求将输入

数据进行分割之后再送入循环神经网络中预测。2014 年 Graves 等人将这一方法用于语音识

别问题[14]，通过和循环神经网络整合来完成语音识别任务。CTC 解决问题的关键思路是引

入了空白符以及消除重复，以及用一个映射函数将循环神经网络的原始输出序列映射为最终

需要的标签序列。

假设训练样本集为 S，训练样本服从概率分布

X Z



。输入空间是输入序列的集合，定

义为：

 



 

这是所有 m 维实向量序列的集合。目标空间是我们需要的预测结果序列的集合，定义

为：

Z L





这是建立在包含有限个字母集 L 之上的标签序列的集合，我们将 L*中的元素称为标签

序列。对于语音识别，L 是文字字典，L*是识别出来的句子。训练样本集中的每个样本是一

个序列对(x,z)。其中输入序列为：

 

x x ,..., x



目标序列为：

 

z z ,..., z



这有一个约束条件，目标序列的长度不大于输入序列的长度，即

U T

。由于输出序列

的长度与输入序列的长度可能不相等，因此无法用先验知识将它们对齐，即让输出序列的某

些元素和输入序列的某一个元素对应起来。我们的目标是用训练样本集训练一个时序分类

器：

:h X Z

然后用它对新的输入序列进行分类。分类时，要让定义的某种误差最小化。要使用循环

神经网络对时序数据进行分类，其中关键的步是将循环神经网络的输出值转换成某一个序列

的条件概率值。这样，我们通过寻找使得这个条件概率最大化的输出序列来完成对输入序列

剩余34页未读，继续阅读

SIGAI_csdn

粉丝: 2352

循环神经网络：记忆序列数据的力量

双曲深度神经网络研究综述

神经网络技术综述：理论与应用深度解析

循环神经网络理论与应用探讨

循环神经网络研究综述.pdf

全面综述：循环神经网络进展

循环神经网络的发展综述.pdf

前馈神经网络和循环神经网络的鲁棒性验证综述_刘颖.caj

深度神经网络综述

神经网络综述.docx

囊泡库的循环综述PPT教案.pptx

最新资源