深度学习：详解卷积神经网络的前向传播

187 浏览量更新于2024-08-31 收藏 554KB PDF 举报

"本文主要介绍了卷积神经网络（CNN）的基本结构、卷积操作以及前向传播算法。CNN的核心组成部分包括输入层、卷积层、池化层和全连接层，其中卷积层和池化层是CNN区别于深度神经网络（DNN）的特色所在。卷积操作在CNN中扮演着提取特征的关键角色，它通过滤波器（卷积核）对输入数据进行扫描，产生特征映射。" 卷积神经网络（CNN）是一种广泛应用在图像识别、语音识别和自然语言处理等领域的深度学习模型。它的基本结构由输入层、卷积层、池化层和全连接层组成。输入层接收图像或其他多维数据，通常以矩阵形式表示。卷积层是CNN的特有层，它使用卷积运算来提取输入数据中的特征。卷积层的激活函数通常是ReLU（Rectified Linear Unit），其表达式为ReLU(x) = max(0, x)，这个函数能够引入非线性，并且在计算上效率较高。池化层紧随卷积层之后，用于降低数据的维度，减少计算量，同时也起到防止过拟合的作用。常见的池化操作有最大池化和平均池化，池化层不使用激活函数。在实际应用中，卷积层和池化层可以多次交替出现，形成深层的特征提取网络。卷积操作在CNN中至关重要，它通过滑动一个固定大小的滤波器（卷积核）在输入数据上进行运算，产生新的特征映射。这个过程可以视为卷积核与输入数据的乘法和求和，可以看作是数学上的卷积。对于二维卷积，输入数据X和卷积核W的卷积结果是通过逐元素相乘后求和得到的。在CNN中，为了适应多维数据，卷积核也可以是多维矩阵或张量。卷积操作的一个直观例子是计算两枚骰子点数之和为4的概率。假设我们有两个概率分布函数，分别对应两枚骰子的点数，通过卷积可以求得所有可能的点数组合的概率总和，从而得到目标点数的概率。前向传播算法是CNN运行的基础，它从输入层开始，经过一系列的卷积和池化操作，最后通过全连接层将特征映射转化为分类结果。全连接层类似于传统的深度神经网络，每个神经元都与前一层的所有神经元相连，其输出层通常使用Softmax函数进行多分类。总结来说，卷积神经网络通过其独特的卷积层和池化层实现高效特征提取，而前向传播算法则将这些特征转化为预测输出。理解这些基本概念对于理解和构建CNN模型至关重要。

卷积神经网络之前向传播算法卷积神经网络之前向传播算法

1.CNN基本结构

首先我们来看看卷积神经网络(CNN)的基本结构。如上图所示，可以看出最左边的图片就是我们的输入层，计算机理解为输入

若干个矩阵。接着是卷积层(Convolution Layer)，卷积层是CNN所特有的，卷积层使用的激活函数是ReLU，之前在DNN之中

介绍过ReLU的激活函数，形式如ReLU=max(0,x) 。卷积层后面的是池化层，池化层也是CNN所特有的，池化层没有激活函

数。

卷积层+池化层的组合可以在CNN隐藏层中出现多次，实际使用中根据模型需要而定。同时我们也可以灵活使用卷积层+卷积

层，或者卷积层+卷积层+池化层的组合，卷积层+池化层的组合在构建模型时没有限制，但最常见的CNN都是若干卷积层+池

化层的组合。

在若干卷积层+池化层的组合后面是全连接层(Fully Connected Layer)，全连接层就是之前讲到的DNN结构，只是输出层使用

了Softmax激活函数来做图像识别的分类。从上面模型可以看出，CNN相对于DNN，比较特殊的是卷积层和池化层。如果之

前熟悉DNN的话，只要把卷积层和池化层的原理理解清楚，那么CNN就简单啦。

2.卷积

既然是学习卷积神经网络，那自然需要了解什么是卷积。在学习高等数学的时候，微积分中卷积表达式和其离散形式如下所

示。

当然也可以用矩阵进行表达，其中*****表示卷积。

s(t)=(X*W)(t)

如果是二维的卷积，则其表达式如下所示。

在CNN中，虽然我们也是说卷积，但严格意义上和数学上所定义的卷积稍有不同，比如对于二维的卷积，其定义如下所示，

其中X为输入，W为卷积核。如果X是二维输入，那么W也是二维矩阵，如果X是多维张量，那么W也是多维张量。

卷积有什么简单利用呢？我们举个例子，假如有两枚骰子，然后把骰子扔出去，求两枚骰子点数之和加起来为4的概率是多

少。

上述例子的关键点便是两个骰子点数之和加起来要等于4，这正是卷积的应用场景。假设利用f表示第一枚骰子，g表示第二枚

骰子。f(1)表示点数为1的概率，f(2)表示点数为2的概率。那么两枚骰子点数加起来为4的情况有f(1)g(3)、f(2)g(2)、f(3)g(1)，

因此两枚骰子点数加起来为4的概率为f(1)g(3)+f(2)g(2)+f(3)g(1)。符合卷积的定义，那么转换成卷积的标准形式便是

3.CNN卷积层

现在我们来深入CNN中的卷积层，如下图所示，针对图像进行卷积计算。图中的输入是二维的3*4的矩阵，卷积核是2*2的矩

阵。这里我们假设卷积是每次移动一个像素来进行卷积，首先对左上角2*2局部和卷积核进行卷积计算，即各个位置的元素相

乘再相加，得到的输出值S00为aw+bx+ey+fz。接着我们将输入的局部向右平移一个像素，现在是(b,c,f,g)四个元素构成的矩

下载后可阅读完整内容，剩余5页未读，立即下载

weixin_38569109

粉丝: 7
资源: 955

深度学习：详解卷积神经网络的前向传播

卷积神经网络前向及反向传播过程数学解析.pdf

2. 三层简单神经网络的前向传播算法.ipynb

CNN算法流程详解说明

卷积神经网络的反向传播算法详解

卷积神经网络的反向传播算法什么时候进行

基于卷积神经网络文字语种识别算法

基于深度卷积神经网络的物体识别算法

基于卷积神经网络的图像分类算法.pdf

基于卷积神经网络的入侵检测算法.pdf

基于卷积神经网络文字语种识别算法.zip

最新资源