卷积神经网络CNN的发展与应用

版权申诉

48 浏览量更新于2024-06-28 收藏 1.45MB PDF 举报

"该文档主要介绍了卷积神经网络（CNN）的基本概念、历史发展及其在模式识别领域的应用，特别是与LeNet-5模型相关的知识。" 卷积神经网络（CNN）是一种深度学习模型，特别适用于图像处理和计算机视觉任务。它的核心特征在于卷积层和池化层，这两个组件使得CNN能够有效地提取图像特征并实现平移不变性。卷积层通过使用可学习的滤波器（或称权重）对输入图像进行扫描，这些滤波器在不同位置应用，但参数共享，减少了模型的复杂性。池化层则用于降低数据维度，进一步减少计算量并提高模型的泛化能力。 CNN的历史可以追溯到1962年，当时Hubel和Wiesel的研究启发了这种网络结构的设计。1980年，Fukushima提出的Neocognitron是最早的CNN实现，它利用局部连接和权值共享来模拟大脑的视觉处理机制。1986年，随着反向传播（BP）算法的发展，LeCun等人改进了CNN，通过误差梯度训练网络，并在手写数字识别任务中取得了突破。他们的LeNet-5模型是第一个成功的卷积神经网络，它能直接处理原始图像，无需大量预处理。然而，由于当时计算资源的限制，LeNet-5在处理大规模图像分类任务时表现不佳，导致CNN的研究一度陷入低谷。直到2006年，Hinton的深度学习研究引发了复兴，CNN再次成为研究焦点。后续的研究者，如Krizhevsky等，通过增加网络深度、优化训练策略和引入大数据集，极大地提升了CNN的性能，使其在ImageNet等大型图像识别挑战中取得了前所未有的成果。近年来，CNN不仅在图像识别领域，还在语音识别、自然语言处理、视频分析等领域展现出强大的能力。同时，各种变体和改进的CNN架构，如VGG、ResNet、Inception等，不断推动着深度学习技术的进步。如今，CNN已经成为现代人工智能系统中不可或缺的一部分，对于理解和解决复杂的数据密集型问题发挥着关键作用。

2.2.1 卷积层〔The convolutional layer〕

1、局部感知

卷积神经网络有两种神器可以降低参数数目，第一种神器叫做局部感知野。

一般认为人对外界的认知是从局部到全局的，而图像的空间联系也是局部的像

素联系较为紧密，而距离较远的像素相关性那么较弱。因而，每个神经元其实

没有必要对全局图像进行感知，只需要对局部进行感知，然后在更高层将局部

的信息综合起来就得到了全局的信息。网络局部连通的思想，也是受启发于生

物学里面的视觉系统结构。视觉皮层的神经元就是局部接受信息的〔即这些神

经元只响应某些特定区域的刺激〕。如下列图所示：左图为全连接，右图为局部

连接。

在上右图中，假设每个神经元只和它前一层邻近的 10×10 个像素值相连，那

么权值数据为 1000000×100 个参数，减少为原来的万分之一。而那 10×10 个像

素值对应的 10×10 个参数，其实就相当于卷积操作。

2、权值共享

但其实这样的话参数仍然过多，那么就启动第二级神器，即权值共享。在上

面的局部连接中，每个神经元都对应 100 个参数，一共 1000000 个神经元，如

果这 1000000 个神经元的 100 个参数都是相等的，那么参数数目就变为 100 了。

怎么理解权值共享呢？我们可以这 100 个参数〔也就是卷积操作〕看成是提

取特征的方式，该方式与位置无关。这其中隐含的原理那么是：图像的一局部

的统计特性与其他局部是一样的。这也意味着我们在这一局部学习的特征也能

用在另一局部上，所以对于这个图像上的所有位置，我们都能使用同样的学习

特征。

更直观一些，当从一个大尺寸图像中随机选取一小块，比方说 8×8 作为样

本，并且从这个小块样本中学习到了一些特征，这时我们可以把从这个 8×8 样

本中学习到的特征作为探测器，应用到这个图像的任意地方中去。特别是，我

们可以用从 8×8 样本中所学习到的特征跟原本的大尺寸图像作卷积，从而对这

个大尺寸图像上的任一位置获得一个不同特征的激活值。

如下列图所示，展示了一个 3×3 的卷积核在 5×5 的图像上做卷积的过程。每

个卷积都是一种特征提取方式，就像一个筛子，将图像中符合条件的局部筛选

出来。

〔图片为 gif 格式〕

3、多卷积核

上面所述只有 100 个参数时，说明只有 1 个 10×10 的卷积核，显然，特征提

取是不充分的，我们可以添加多个卷积核，比方 32 个卷积核，可以学习 32 种

特征。在有多个卷积核时，如下列图所示：

上图右，不同颜色说明不同的卷积核。每个卷积核都会将图像生成为另一幅

图像。比方两个卷积核就可以将生成两幅图像，这两幅图像可以看做是一张图

像的不同的通道，如下列图所示。

下列图展示了在四个通道上的卷积操作，有两个卷积核，生成两个通道。其

中需要注意的是，四个通道上每个通道对应一个卷积核，先将𝑊

忽略，只看𝑊

，

那么在𝑊

的某位置(𝑖, 𝑗)处的值，是由四个通道上(𝑖, 𝑗)处邻近区域的卷积结果相

加然后再取激活函数〔假设选择 tanh 函数〕值得到的。

剩余21页未读，继续阅读

G11176593

粉丝: 6917
资源: 3万+

卷积神经网络CNN的发展与应用

卷积神经网络CNN.pdf

CNN卷积神经网络原理 (3).pdf

卷积神经网络（CNN）.pdf

Get清风卷积神经网络CNN (2).pdf

Get清风卷积神经网络CNN (2).docx

Python通过TensorFlow卷积神经网络实现猫狗识别.pdf

matlab卷积神经网络cnn数字识别

Get清风RedHatLinux常用命令汇总.pdf

基于优化卷积神经网络结构的交通标志识别.pdf

Get清风Matlab命令大全.pdf

最新资源