没有合适的资源?快使用搜索试试~ 我知道了~
首页RNN及LSTM,联系与区别
RNN及LSTM,联系与区别
需积分: 47 3.7k 浏览量
更新于2023-05-24
评论
收藏 1.79MB DOCX 举报
循环神经网络(Recurrent Neural Networks,RNNs)已经在众多自然语言处理(Natural Language Processing, NLP)中取得了巨大成功以及广泛应用,RNNs主要用来处理序列数据。
资源详情
资源评论
资源推荐

RNN
循环神经网络(Recurrent Neural Networks,RNNs)已经在众多自然语言处理
(Natural Language Processing, NLP)中取得了巨大成功以及广泛应用,RNNs 主要
用来处理序列数据。
RNNs 包含输入单元(Input units),输入集标记为 ;
输出单元(Output units)的输出集则被标记为 ;
隐藏单元(Hidden units),将其输出集标记为 。
在图中:有一条单向流动的信息流是从输入单元到达隐藏单元的,与此同
时另一条单向流动的信息流从隐藏单元到达输出单元。在某些情况下,RNNs
会打破后者的限制,引导信息从输出单元返回隐藏单元,这些被称为“Back
Projections”,并且隐藏层的输入还包括上一隐藏层的状态,即隐藏层内的节点
可以自连也可以互连。q

上图将循环神经网络进行展开成一个全神经网络。例如,对一个包含 5 个
单词的语句,那么展开的网络便是一个五层的神经网络,每一层代表一个单词。
对于该网络的计算过程如下:
1. 表示第 t,t=1,2,3...步(step)的输入。比如 为第二个词的 one-hot 向量
(根据上图, 为第一个词);q
2. 为隐藏层的第 t 步的状态,它是网络的记忆单元。 q根据当前输入层
的输出与上一步隐藏层的状态进行计算。 ,其中 f 一般是非线
性的激活函数,如 tanh 或 ReLU,在计算 时,即第一个单词的隐藏层状态,
需要用到 ,但是其并不存在,在实现中一般置为 0 向量;
3. 是第 t 步的输出,如下个单词的向量表示, q
需要注意的是:
1.你可以认为隐藏层状态 是网络的记忆单元。 q包含了前面所有步的
隐藏层状态。而输出层的输出 只与当前步的 有关,在实践中,为了降低网
络的复杂度,往往 只包含前面若干步而不是所有步的隐藏层状态;

2.在 RNNs 中,每输入一步,每一层各自都共享参数 U、V、W。其反应
了 RNNs 中的每一步都在做相同的事,只是输入不同,因此大大地降低了网络
中需要学习的参数。
3.上图中每一步都会有输出,但不是必须的。比如我们需要预测一条语句
所表达的情绪,我们仅仅需要关心最后一个单词输入后的输出,而不需要知道
每个单词输入后的输出,同理每步都需要输入也不是必须的。RNNs 的关键之
处在于隐藏层,隐藏层能够捕捉序列的信息。
这个网络在 t 时刻接收到输入 之后,隐藏层的值是 ,输出值是 。关键
一点是, 的值不仅仅取决于 ,还取决于 。我们可以用下面的公式来表示
循环神经网络的计算方法:
(式 1) (1)
(式 2) (2)
式 1 是输出层的计算公式,输出层是一个全连接层,也就是它的每个节点
都和隐藏层的每个节点相连。V 是输出层的权重矩阵,g 是激活函数。式 2 是隐

藏层的计算公式,它是循环层。U 是输入 x 的权重矩阵,W 是上一次的值 作
为这一次的输入的权重矩阵,f 是激活函数。
从上面的公式我们可以看出,循环层和全连接层的区别就是循环层多了一
个权重矩阵qW。
如果反复把式 2 带入到式 1,我们将得到:
(3)
(4)
(5)
(6)
(7)
从上面可以看出,循环神经网络的输出值 ,是受前面历次输入值
影响的,这就是为什么循环神经网络可以往前看任意多
个输入值的原因。

1. 训练算法
如果将 RNNs 进行网络展开,那么参数 W、U、V 是共享的,并且在使用
梯度下降算法中,每一步的输出不仅依赖当前步的网络,还依赖前面若干步网
络的状态。比如,在 t=4 时,我们还需要向后传递三步,后面的三步都需要加
上各种的梯度。该学习算法称为 Backpropagation Through Time (BPTT)。BPTT
算法是针对循环层的训练算法,它的基本原理和 BP 算法是一样的,也包含同
样的三个步骤:
1) 前向计算每个神经元的输出值;
2) 反向计算每个神经元的误差项值 ,它是误差函数 E 对神经元 j 的加权
输入的 偏导数;
3) 计算每个权重的梯度。
最后再用随机梯度下降算法更新权重。
需要意识到的是,在 vanilla RNNs 训练中,BPTT 无法解决长时依赖问题
(即当前的输出与前面很长的一段序列有关,一般超过十步就无能为力了),因
剩余30页未读,继续阅读












安全验证
文档复制为VIP权益,开通VIP直接复制

评论0