卷积神经网络CNN详解：从LeNet到深度学习的突破

13 浏览量更新于2024-08-30 收藏 361KB PDF 举报

"本文主要介绍了卷积神经网络（CNN）的基本概念，包括卷积层、池化层，以及经典的LeNet模型。同时提到了AlexNet，它是深度卷积网络的一个重要里程碑，克服了早期CNN的一些局限性。" 卷积神经网络（CNN）是一种广泛应用于图像识别和计算机视觉任务的深度学习模型，其核心在于卷积层和池化层的设计。卷积层通过卷积运算（实际上执行的是互相关运算）提取输入图像的特征，而卷积核（或过滤器）是学习得到的权重矩阵。卷积层有两个重要的超参数：填充（padding）用于保持输入尺寸不变，步幅（stride）决定了卷积核移动的步长。这两个参数可以灵活调整，以影响输出特征图的大小和模型的复杂度。池化层是CNN中的另一个关键组件，其目的是降低模型对位置的敏感性并减少计算量。池化层通常采用最大池化或平均池化，前者取池化窗口内的最大值，后者取平均值，以此来提取关键信息并减少数据维度。 LeNet是最早的卷积神经网络之一，由Yann LeCun等人提出。它由卷积层块和全连接层两部分组成。卷积层块由卷积层和平均池化层交替堆叠，用于识别图像特征；全连接层负责将提取的特征映射到类别输出。LeNet的成功在于利用卷积层解决了全连接层在处理大型图像时的参数过多问题，但随着数据集的增长，LeNet的结构显得过于简单。 AlexNet是2012年ImageNet竞赛的冠军，由Alex Krizhevsky设计，标志着深度学习在图像识别领域的突破。相比LeNet，AlexNet更深、更宽，包含多个卷积层和池化层，有效处理更大规模的数据。此外，AlexNet引入了ReLU激活函数，解决了Sigmoid等激活函数的梯度消失问题，还使用了数据增强技术，增加了模型的泛化能力。这些创新使得AlexNet在训练大型数据集时效果显著优于LeNet，推动了深度学习的快速发展。 CNN通过卷积和池化操作有效地捕获图像的局部特征，并通过多层结构实现特征的逐级抽象，从而在图像识别等领域表现出强大的性能。从LeNet到AlexNet的发展，展示了深度学习模型如何通过增加网络深度和优化技术，逐步克服早期的计算和泛化难题，进而引领了现代计算机视觉领域的进步。

CNN、、LeNet

一、卷积神经网络一、卷积神经网络

卷积层：卷积层：卷积层得名于卷积运算，但卷积层中用到的并非卷积运算而是互相关运算。我们将核数组核数组 (通常称为卷积核或过滤器（通常称为卷积核或过滤器（filter））)上下翻

转、左右翻转，再与输入数组做互相关运算，这一过程就是卷积运算。由于卷积层的核数组是可学习的，所以使用互相关运算与使用卷积运算

并无本质区别。

卷积层的两个超参数：填充填充：在输入高和宽的两侧填充元素（通常是0元素）

步幅步幅：在互相关运算中，卷积核在输入数组上滑动，每次滑动的行数与列数即是步幅（stride）

池化层：池化层：池化层主要用于缓解卷积层对位置的过度敏感性。同卷积层一样，池化层每次对输入数据的一个固定形状窗口（又称池化窗口）中的

元素计算输出，池化层直接计算池化窗口内元素的最大值或者平均值，该运算也分别叫做最大池化或平均池化。

二、二、LeNet

Convolutional Neural Networks

使用全连接层的局限性：

图像在同一列邻近的像素在这个向量中可能相距较远。它们构成的模式可能难以被模型识别。

对于大尺寸的输入图像，使用全连接层容易导致模型过大。

使用卷积层的优势：

卷积层保留输入形状。

卷积层通过滑动窗口将同一卷积核与不同位置的输入重复计算，从而避免参数尺寸过大。

LeNet模型分为卷积层块和全连接层两个部分。

卷积神经网络就是含卷积层的网络。卷积神经网络就是含卷积层的网络。 LeNet交替使用卷积层和最大池化层后接全连接层来进行图像分类。交替使用卷积层和最大池化层后接全连接层来进行图像分类。

卷积层块里的基本单位是卷积层后接平均池化层：卷积层块里的基本单位是卷积层后接平均池化层：卷积层用来识别图像里的空间模式，如线条和物体局部，之后的平均池化层则用来降低卷积

层对位置的敏感性。

卷积层块由两个这样的基本单位重复堆叠构成。在卷积层块中，每个卷积层都使用5×55×5的窗口，并在输出上使用sigmoid激活函数。第一个

卷积层输出通道数为6，第二个卷积层输出通道数则增加到16。

全连接层块含3个全连接层。它们的输出个数分别是120、84和10，其中10为输出的类别个数。

三、深度卷积网络三、深度卷积网络(AlexNet)

LeNet:

LeNet: 在大的真实数据集上的表现并不尽如意。

1.神经网络计算复杂。

2.还没有量深研究参数初始化和凸优化算法等诸多领域。

机器学习的特征提取特征提取：手工定义的特征提取函数

神经网络的特征提取特征提取：通过学习得到数据的多级表征，并逐级表越来越抽象的概念或模式。

神经网络发展的限制:数据、硬件

AlexNet:

AlexNet: 首次证明了学习到的特征可以超越设计的特征，从而举打破计算机视觉研究的前状。

特征：特征：

1. 8层变换，其中有5层卷积和2层全连接隐藏层，以及1个全连接输出层。

2. 将sigmoid激活函数改成了更加简单的ReLU激活函数。

3. 用Dropout来控制全连接层的模型复杂度。

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38551187

粉丝: 3
资源: 908

卷积神经网络CNN详解：从LeNet到深度学习的突破

CNN LeNet模型学习笔记与Python代码实践

使用numpy实现的经典CNN模型LeNet5教程

Python深度学习实践：实现LeNet5卷积网络

numpy实现CNN LeNet5.zip

Python实现CNN LeNet5卷积神经网络实例

CNN_LeNet_test原实验.rar

CNN_LeNet-5_onedimension:关于如何将CNN与一维信号一起使用

cnn的matlab代码-CNN_LeNet:从现有的Matlab代码重写的CNNLeNet的C++代码

CNN的硬件实现，由Verilog编写并在FPGA上合成 fpga verilog cnn rtl lenet Cop语言

资源下载CNN-LeNet-test - 卷积神经网络测试模型

最新资源