深度学习入门(3) - 神经网络与反向传播算法解析

需积分: 0 153 浏览量更新于2024-06-30 2 收藏 1.87MB PDF 举报

"零基础入门深度学习系列教程的第三部分主要讲解神经网络和反向传播算法，适合初学者，旨在让没有太多数学背景的程序员掌握深度学习基础知识。文章包括感知器、线性单元和梯度下降等内容的回顾，并将这些单元组合成神经网络，介绍反向传播算法的原理和实现，最终通过代码实现神经网络并应用于手写数字识别。" 在深度学习领域，神经网络是其核心组成部分，模仿人脑神经元的工作机制，由大量的处理单元（称为神经元）组成。神经元接收多个输入信号，通过加权和非线性转换产生输出。每个输入都与神经元关联一个权重，这些权重决定了输入信号对输出的影响程度。在感知器的基础上，神经元引入了激活函数，如sigmoid或ReLU，以引入非线性特性，使网络能够处理更复杂的问题。反向传播算法是训练神经网络的关键步骤，它利用梯度下降法来更新权重。在前向传播过程中，网络根据当前权重计算出预测输出与实际输出的误差。反向传播则是从输出层开始，逆向地计算每个神经元对其贡献的误差，并根据误差梯度调整权重，以减小总体误差。这一过程反复进行，直到网络的预测输出接近真实输出，或者达到预设的训练次数。在本教程中，作者将详细介绍如何构建多层神经网络，每一层包含多个神经元，以及如何使用反向传播进行训练。通过实例，比如手写数字识别问题，读者可以直观地理解神经网络的工作原理及其在解决实际问题中的应用。此外，前两篇教程中，感知器作为最简单的神经网络模型，介绍了基础的二分类问题解决。线性单元和梯度下降则进一步解释了如何通过优化权重来改善模型性能，为后续的神经网络学习打下基础。这个系列教程为初学者提供了逐步深入深度学习的路径，从简单的模型开始，逐渐过渡到更复杂的神经网络结构和训练方法，最终实现实际问题的求解。通过阅读和实践这些教程，程序员能够掌握深度学习的基本概念和技术，为进一步学习更高级的深度学习模型如卷积神经网络、循环神经网络等奠定基础。

4/3/2018 零基础入门深度学习(3) - 神经网络和反向传播算法 - 作业部落 Cmd Markdown 编辑阅读器

https://www.zybuluo.com/hanbingtao/note/476663 5/24

现在，我们把上述计算的四个式子写到一个矩阵里面，每个式子作为矩阵的一行，就可以利用矩阵来表

示它们的计算了。令

带入前面的一组式子，得到

在式2中，是激活函数，在本例中是函数；是某一层的权重矩阵；是某层的输入向量；是某层的输出

向量。式2说明神经网络的每一层的作用实际上就是先将输入向量左乘一个数组进行线性变换，得到一个新的向量，

然后再对这个向量逐元素应用一个激活函数。

每一层的算法都是一样的。比如，对于包含一个输入层，一个输出层和三个隐藏层的神经网络，我们假设其权重矩

阵分别为，每个隐藏层的输出分别是，神经网络的输入为，神经网络的输入为，如下图

所示：

则每一层的输出向量的计算可以表示为：

这就是神经网络输出值的计算方法。

神经网络的训练

现在，我们需要知道一个神经网络的每个连接上的权值是如何得到的。我们可以说神经网络是一个模型，那么这些

权值就是模型的参数，也就是模型要学习的东西。然而，一个神经网络的连接方式、网络的层数、每层的节点数这

些参数，则不是学习出来的，而是人为事先设置的。对于这些人为设置的参数，我们称之为超参数(Hyper-

Parameters)。

接下来，我们将要介绍神经网络的训练算法：反向传播算法。

反向传播算法(Back Propagation)

我们首先直观的介绍反向传播算法，最后再来介绍这个算法的推导。当然读者也可以完全跳过推导部分，因为即使

不知道如何推导，也不影响你写出来一个神经网络的训练代码。事实上，现在神经网络成熟的开源实现多如牛毛，

除了练手之外，你可能都没有机会需要去写一个神经网络。

式

剩余23页未读，继续阅读

我要WhatYouNeed

粉丝: 48
资源: 287

深度学习入门(3) - 神经网络与反向传播算法解析

零基础入门深度学习：卷积神经网络详解

零基础入门深度学习系列：从机器学习到神经网络

深度学习入门：循环神经网络前向和反向计算。

零基础入门深度学习(3) - 神经网络和反向传播算法

零基础入门深度学习(3) - 神经网络和反向传播算法 - 作业部落 Cmd Markdown 编辑阅读器.pdf

零基础入门深度学习(4) - 卷积神经网络1

零基础入门深度学习(5) - 循环神经网络1

零基础入门深度学习(5) - 循环神经网络.pdf

零基础入门深度学习(4) - 卷积神经网络 - 作业部落 Cmd Markdown 编辑阅读器.pdf

零基础入门深度学习(7) - 递归神经网络 - 作业部落 Cmd Markdown 编辑阅读器.pdf

最新资源