Python实现吴恩达深度学习RNN前向传播详解：数据向量化与维度构建

111 浏览量更新于2024-08-30 收藏 166KB PDF 举报

本文主要讲解如何用纯Python实现吴恩达DeepLearning.ai课程中的循环神经网络（RNN）向前传播过程。在深度学习中，RNN是一种特殊类型的神经网络，特别适合处理序列数据，如文本、语音或视频。本文的核心知识点包括以下几个方面： 1. **向量表示及其维度**： - 输入向量：每个单个输入样本x(i)是一维向量，例如在自然语言处理中，如果使用one-hot编码，一个具有5000个单词词汇量的语言会对应一个具有5000个单位的向量，其维度为(5000,)。 - 小批量处理：当使用小批量训练时，比如每批包含20个样本，这些样本构成一个二维数组，如(5000, 20)，用变量m表示训练样本数量，因此批量数据的维度为(nx, m)。 - 时间步骤：RNN有多个时间步骤，用变量t表示，如每个样本经历10个时间步骤，则Tx=10。输入数据表示为三维张量(nx, m, Tx)。 2. **RNN Cell**： - RNN Cell是循环神经网络的基本构建块，它负责处理当前时间步的信息并传递给下一个时间步。cell的内部状态和计算是关键部分，用于捕捉序列数据中的长期依赖关系。 3. **RNN向前传播**： - 实现RNN向前传播主要分为两步： a. **单个单元的RNN计算**：这涉及到对每个时间步骤进行计算，包括输入向量与当前隐藏状态的线性变换，加上偏置，然后通过激活函数如sigmoid或ReLU。 b. **拉通整个序列**：将单个单元的计算结果按时间顺序串联起来，形成整个序列的隐藏状态，这是RNN特有的记忆机制，允许信息在时间上流动。 4. **隐藏状态的表示**： - 隐藏状态a是RNN的关键输出，表示从一个时间步到另一个时间步的激活值。单个训练样本的隐藏状态向量长度为na，而包含m个样本的小批量数据的隐藏状态维度则为(na, m)。在考虑时间步后，隐藏状态的最终维度为(na, m, Tx)。通过理解这些概念和步骤，读者可以手动实现RNN的前向传播过程，这对于深入理解循环神经网络的工作原理和实践应用非常有用。吴恩达的课程和本文提供的指导，可以帮助读者巩固理论知识，并在实践中掌握RNN的具体实现。

用纯用纯Python实现循环神经网络实现循环神经网络RNN向前传播过程向前传播过程(吴恩达吴恩达DeepLearning.ai

作业作业)

Google TensorFlow程序员点赞的文章！程序员点赞的文章！

前言前言

– 向量表示以及它的维度

– rnn cell

– rnn 向前传播

重点关注:

– 如何把数据向量化的，它们的维度是怎么来的

– 一共其实就是两步: 单个单元的rnn计算，拉通来的rnn计算

在看本文前，可以先看看这篇文章回忆一下:

吴恩达deepLearning.ai循环神经网络RNN学习笔记(理论篇)

我们将实现以下结构的RNN，在这个例子中 Tx = Ty。

向量表示以及它的维度向量表示以及它的维度

Input with nx number of units

对单个输入样本，x(i) 是一维输入向量。

用语言来举个例子，将具有5k个单词词汇量的语言用one-hot编码成具有5k个单位的向量，所以 x(i) 的维度是(5000,)。

我们将用符号 nx 表示单个训练样本的单位数。

Batches of size m

如果我们取小批量(mini-batches)，每个批次有20个训练样本。

为了受益于向量化，我们将20个样本 x(i) 变成一个2维数组(矩阵)。

比如一个维度是(5000，20)的向量。

我们用m来表示训练样本的数量。

所以小批量训练数据的维度是 (nx, m)。

Time steps of size Tx

循环神经网络有多个时间步骤，我们用t来表示。

我们将看到训练样本 x(i) 将经历多个时间步骤 Tx, 比如如果有10个时间步骤，那么 Tx = 10。

3D Tensor of shape (nx, m, Tx)

输入x就是用维度是 (nx, m, Tx) 的三维张量来表示。

Taking a 2D slice for each time step:

每一个时间步骤，我们用小批量训练样本(不是单个的训练样本)。

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38735790

粉丝: 4
资源: 899

Python实现吴恩达深度学习RNN前向传播详解：数据向量化与维度构建

循环神经网络python实现

神经网络与深度学习（吴恩达）第二周编程练习（含所有源代码及答案代码、h5数据文件）

Python实现循环神经网络RNN

吴恩达Deeplearning.ai课后作业收集02课

吴恩达Deeplearning.ai课后作业收集04课第一周四

吴恩达deeplearning.ai第二课编程作业全部（包含源数据）

cousera吴恩达deeplearning.ai汇总笔记（非原创）

吴恩达老师deeplearning.ai-第一课作业

吴恩达老师deeplearning.ai-第五课第三周作业

吴恩达Coursera深度学习课程 deeplearning.ai (1-4) 深层神经网络--作业（可执行源码）

最新资源