深度学习入门(7)：递归神经网络解析与应用

需积分: 0 72 浏览量更新于2024-06-30 收藏 1.71MB PDF 举报

"这篇教程是《零基础入门深度学习》系列的第七部分，主要讲解了递归神经网络(Recursive Neural Network, RNN)的概念及其在处理递归结构数据中的应用。作者强调，此系列文章适合没有太多数学背景的程序员学习，通过代码实例帮助读者理解深度学习的基本原理。在之前的章节中，已经介绍了感知器、线性单元、梯度下降、神经网络、反向传播算法、卷积神经网络和循环神经网络。递归神经网络作为一种能够处理如树和图等复杂结构的网络，弥补了循环神经网络在这方面的不足，并引入了结构化反向传播(BPTS)的训练方法。" 在深度学习领域，递归神经网络(RNN)是一个重要的模型，尤其适用于处理具有序列或者层次结构的数据。与传统的前馈神经网络和循环神经网络不同，RNN的特点在于其内部状态可以依赖于自身之前的输出，形成一个循环结构。这使得RNN在处理时间序列数据（如语音识别、自然语言处理）时能保持长期依赖的记忆。递归神经网络的核心在于其递归性质，这意味着网络可以对任意深度的结构进行建模。在处理树结构数据时，每个节点的输出不仅取决于当前输入，还取决于其子节点的输出，这在处理如语法分析、句法树构建等任务时非常有用。递归神经网络的一个经典应用场景是自然语言理解，比如解析句子的句法结构，理解嵌套短语的含义。训练RNN时，由于其循环结构，反向传播算法需要考虑到时间维度的影响，这就是所谓的“反向传播通过时间”(Backpropagation Through Time, BPTT)。BPTT在计算梯度时会沿着时间轴展开网络，有效地将RNN转化为一个宽得多的前馈神经网络，然后应用标准的反向传播算法。这种方法虽然有效，但在处理长序列时可能会遇到梯度消失或爆炸的问题。为了解决这些问题，后续发展出了一些改进版的RNN，例如长短时记忆网络(Long Short-Term Memory, LSTM)和门控循环单元(Gated Recurrent Unit, GRU)。这些模型通过引入额外的门控机制来更好地控制信息的流动，从而缓解了长时间依赖问题。在实际应用中，递归神经网络还可以用于机器翻译、文本生成、情感分析等任务。通过调整网络结构和参数，RNN可以适应各种复杂的数据结构，为解决实际问题提供了强大的工具。对于程序员来说，掌握RNN的基本原理和实现方法是深入理解深度学习不可或缺的一部分。通过阅读《零基础入门深度学习》系列文章，即便没有深厚的数学基础，也能逐步建立起对深度学习的理解并掌握实践技能。

4/3/2018 零基础入门深度学习(7) - 递归神经网络 - 作业部落 Cmd Markdown 编辑阅读器

https://zybuluo.com/hanbingtao/note/626300 4/16

在上式中，tanh是激活函数（当然也可以用其它的激活函数），是偏置项，它也是一个维度为的向量。如果读过

前面的文章，相信大家已经非常熟悉这些计算了，在此不做过多的解释了。

然后，我们把产生的父节点的向量和其他子节点的向量再次作为网络的输入，再次产生它们的父节点。如此递归下

去，直至整棵树处理完毕。最终，我们将得到根节点的向量，我们可以认为它是对整棵树的表示，这样我们就实现

了把树映射为一个向量。在下图中，我们使用递归神经网络处理一棵树，最终得到的向量，就是对整棵树的表

示：

举个例子，我们使用递归神将网络将『两个外语学校的学生』映射为一个向量，如下图所示：

最后得到的向量就是对整个句子『两个外语学校的学生』的表示。由于整个结构是递归的，不仅仅是根节点，事

实上每个节点都是以其为根的子树的表示。比如，在左边的这棵树中，向量是短语『外语学院的学生』的表示，

而向量是短语『外语学院的』的表示。

式1就是递归神经网络的前向计算算法。它和全连接神经网络的计算没有什么区别，只是在输入的过程中需要根据输

入的树结构依次输入每个子节点。

需要特别注意的是，递归神经网络的权重和偏置项在所有的节点都是共享的。

递归神经网络的训练

递归神经网络的训练算法和循环神经网络类似，两者不同之处在于，前者需要将残差从根节点反向传播到各个子节

点，而后者是将残差从当前时刻反向传播到初始时刻。

下面，我们介绍适用于递归神经网络的训练算法，也就是BPTS算法。

剩余15页未读，继续阅读

思想假

粉丝: 34
资源: 325

深度学习入门(7)：递归神经网络解析与应用

wls860707495#Deep-Learning#（七）递归神经网络1

零基础入门深度学习(7) - 递归神经网络 - 作业部落 Cmd Markdown 编辑阅读器.pdf

零基础入门深度学习(5) - 循环神经网络 - 作业部落 Cmd Markdown 编辑阅读器.pdf

零基础入门深度学习合集

零基础入门深度学习.pdf

零基础入门深度学习（hanbingtao）1

零基础入门深度学习 csdn

零基础入门深度学习（hanbingtao）

零基础入门深度学习(系列) 中文PDF完整版

零基础深度学习教程：从感知器到深度神经网络

最新资源