深度学习入门：循环神经网络前向和反向计算。

需积分: 0 122 浏览量更新于2024-01-12 收藏 2.31MB PDF 举报

在深度学习领域，循环神经网络（Recurrent Neural Network, RNN）是一种特殊的神经网络结构，用于处理序列数据，比如语音、文本等。本文主要讨论循环神经网络中的前向计算、反向计算和梯度计算。循环神经网络中的每个神经元都有一个输入和一个输出。在前向计算中，神经元的输出是通过将输入和权重进行线性组合，再通过一个非线性激活函数得到的。这个输出会作为下一个时间步（或下一层）的神经元的输入。由于循环结构，神经网络可以通过时间序列对信息进行传递和记忆，从而更好地处理序列数据。在反向计算中，我们需要计算每个神经元的误差项，以更新网络的权重。误差项表示每个神经元对整体误差的贡献。对于循环神经网络，误差会从输出层一直反向传递到输入层，通过时间序列进行反向传播。这意味着在计算误差项时，我们需要考虑当前时间步的误差，并考虑上一时间步的误差项对当前时间步的影响。计算每个权重的梯度是更新神经网络参数的关键步骤。梯度表示目标函数相对于参数的变化率。通过计算每个权重对整体误差的贡献（即误差项）和输入的乘积，我们可以得到梯度，并使用梯度下降算法来更新权重。深度学习（Deep Learning）是当前热门的技术之一，对于程序员来说，掌握深度学习是非常重要的。本文系列旨在帮助程序员从零基础入门深度学习，无需过多数学知识，只需要掌握编程即可。通过阅读这些文章，你可以了解深度学习的基本概念，包括感知器、线性单元和梯度等。文章中包含很多代码示例，以便程序员更好地理解和实践。随着大数据时代和人工智能时代的到来，深度学习成为程序员不可忽视的技术。通过学习循环神经网络的前向计算、反向计算和梯度计算，程序员可以更好地掌握深度学习的核心方法和技巧，从而在实际应用中取得更好的效果。所以，不管你是零基础还是已有一定基础的程序员，都可以通过学习循环神经网络，提升自己在深度学习领域的能力和竞争力。对于有志于深度学习的程序员来说，《零基础入门深度学习》系列文章将成为你的救命稻草，帮助你从零入门到掌握这一热门技术。

4/3/2018 零基础入门深度学习(5) - 循环神经网络 - 作业部落 Cmd Markdown 编辑阅读器

https://zybuluo.com/hanbingtao/note/541458 4/20

从上面可以看出，循环神经网络的输出值，是受前面历次输入值、、、、...影响的，这就是为什么

循环神经网络可以往前看任意多个输入值的原因。

双向循环神经网络

对于语言模型来说，很多时候光看前面的词是不够的，比如下面这句话：

我的手机坏了，我打算____一部新手机。

可以想象，如果我们只看横线前面的词，手机坏了，那么我是打算修一修？换一部新的？还是大哭一场？这些都是

无法确定的。但如果我们也看到了横线后面的词是『一部新手机』，那么，横线上的词填『买』的概率就大得多

了。

在上一小节中的基本循环神经网络是无法对此进行建模的，因此，我们需要双向循环神经网络，如下图所示：

当遇到这种从未来穿越回来的场景时，难免处于懵逼的状态。不过我们还是可以用屡试不爽的老办法：先分析一个

特殊场景，然后再总结一般规律。我们先考虑上图中，的计算。

从上图可以看出，双向卷积神经网络的隐藏层要保存两个值，一个A参与正向计算，另一个值A'参与反向计算。最终

的输出值取决于和。其计算方法为：

和则分别计算：

现在，我们已经可以看出一般的规律：正向计算时，隐藏层的值与有关；反向计算时，隐藏层的值与有

关；最终的输出取决于正向和反向计算的加和。现在，我们仿照式1和式2，写出双向循环神经网络的计算方法：

剩余19页未读，继续阅读

天眼妹

粉丝: 29
资源: 332

深度学习入门：循环神经网络前向和反向计算。

5--深度学习--循环神经网络

深度学习——循环神经网络

零基础入门深度学习(5) - 循环神经网络.pdf

零基础入门深度学习(5) - 循环神经网络 - 作业部落 Cmd Markdown 编辑阅读器.pdf

零基础入门深度学习(7) - 递归神经网络1

零基础入门深度学习(4) - 卷积神经网络1

零基础入门深度学习(3) - 神经网络和反向传播算法1

零基础入门深度学习(7) - 递归神经网络 - 作业部落 Cmd Markdown 编辑阅读器.pdf

零基础入门深度学习(3) - 神经网络和反向传播算法

零基础入门深度学习-系列博客高清合集pdf

最新资源