深度学习基础：神经网络与反向传播

需积分: 0 40 浏览量更新于2024-08-05 收藏 1.01MB PDF 举报

"神经网络1，讲解了反向传播在神经网络中的应用，通过计算图展示了反向传播如何计算复杂函数的梯度" 在神经网络的学习中，反向传播算法是一项核心的技术，它使得我们能够在庞大的神经网络模型中有效地计算梯度，进而更新网络权重以优化模型性能。在描述中提到，由于神经网络通常包含大量的参数，手动写出所有参数的梯度公式是不切实际的，这就需要反向传播算法来自动化这一过程。反向传播的基本思想源于微积分中的链式法则，它允许我们通过对计算图的反向遍历来求解复杂的函数对各个变量的偏导数，即梯度。计算图是一种可视化工具，用来表示数学计算的过程，其中的节点代表计算步骤，边则表示这些步骤之间的依赖关系。以一个简单的例子为例，假设我们有函数 f(x) = x * (w + q) * y - z，我们可以通过计算图进行前向传播，计算出最终的结果，然后再进行反向传播，计算每个变量的梯度。在反向传播过程中，从输出端开始，利用链式法则计算每个节点的梯度，如f的梯度、z的梯度、q的梯度等，直至计算出输入变量x的梯度。在更复杂的情况下，如涉及到最大值运算的函数，反向传播仍然有效。例如，对于函数 g(w, z) = max(w, z)，其计算图中，当w > z时，w的梯度为1，z的梯度为0；反之，当w < z时，w的梯度为0，z的梯度为1。这是因为最大值运算在梯度中体现了“选择”行为，只有选择的那个变量的梯度为1，另一个为0。同时，如果一个节点连接到多个后续节点，那么在反向传播时，来自不同路径的梯度会在该节点处相加。反向传播在神经网络中的应用不仅仅是计算梯度，它还用于计算偏导数，这对于训练神经网络至关重要。在反向传播过程中，每个节点不仅计算自身的梯度，还会接收上游节点传递下来的梯度，然后乘以其本地梯度，将结果传递给与其相连的下游节点。通过这种方式，反向传播能够有效地处理具有大量非线性变换和并行结构的神经网络，使得我们能够在大规模的神经网络模型中实现高效的训练。

原

2017CS231n李飞飞深度视觉识别笔记（四）——神经网络

2018年07月12日 22:15:53 献世online 阅读数：405 更多

第四讲神经网络

课时1 反向传播

目前，我们已经讲了怎么定义一个分类器、怎么定义一个损失函数以及它的正则化，也讨论了用梯度下降的方法找到最小化的损失函数。

接下来，将讨论如何计算任意复杂函数的解析梯度，用到一个叫计算图的框架。大体上说，计算图就是用这类图来表示任意函数，其中图的节点表示要执行的每

一步计算，比如下图中的例子：

这个线性分类器输入x和W，输出得分向量，另外一个计算节点表示hinge loss，计算数据损失项Li，同时有一个正则化项，最后输入的总的损失函数L就是正则化

项与数据项的和；利用这样的计算图的好处就是能够用反向传播技术，递归地用链式法则来计算每个变量的梯度。

那么反向传播是如何工作的呢？

简单的例子：（1）假设有一个函数，要找到函数输出对应任意变量的梯度，第一步是利用计算图来表示整个函数，例如：

现在要做的是这个网络的前向传播，这里给定了每个变量对应的值，写入计算图中，最后得到的值为-12；计算对应的梯度如下：

而反向传播是链式法则的递归调用，从后往前计算出所有的梯度。

最后一个变量f的梯度为，接下来变量z的梯度为，变量q

的梯度为，变量y的梯度为，变量x的梯度为

。

这里使用的链式法则是为了在有更复杂的计算的时候，用这种方式可以更方便的计算梯度，而在本例中比较简单的时候也可以直接计算不需要链式相乘。

下载后可阅读完整内容，剩余3页未读，立即下载

maXZero

粉丝: 29
资源: 303

深度学习基础：神经网络与反向传播

最新神经网络LICENSE

BP神经网络Matlab程序例子--绝对经典

04 BP神经网络_BP_pictureckd_BP神经网络_

04-神经网络week41

L04-神经网络和反向传播1

神经网络与深度学习实验04

神经网络教程-神经网络ppt1.rar

chap04-前馈神经网络.pptx

04RBF、GRNN和PNN神经网络

04--神经网络反向传播.md

最新资源