卷积神经网络CNN的发展与应用

版权申诉

10 浏览量更新于2024-06-28 收藏 1.45MB PDF 举报

"本文介绍了卷积神经网络（CNN）的基本概念、历史发展以及其在模式识别领域的应用。CNN因其局部连接和权值共享的特性，在图像处理和计算机视觉中展现出强大的能力。文章提到了LeNet-5作为最早的正式CNN模型，尽管受限于当时的计算资源，但为后续的发展奠定了基础。" 卷积神经网络（CNN）是一种深度学习模型，它在处理图像和视觉数据方面表现出色，主要归功于其特有的卷积层和池化层结构。卷积层通过滤波器（或称卷积核）对输入图像进行扫描，这些滤波器的参数在整个图像上共享，降低了网络的复杂性，同时也使得网络能够检测到图像中的局部特征。池化层则用于降低数据的维度，提高模型的计算效率，并有助于保持特征的平移不变性。 CNN的历史可以追溯到1962年，当时Hubel和Wiesel的研究启发了这种网络结构。1980年，Fukushima提出的Neocognitron是CNN的早期实现，它引入了权值共享的概念，增强了模型对位置变化的鲁棒性。1986年，随着反向传播（BP）算法的提出，LeCun等人成功地训练了CNN，并在手写数字识别任务中取得了先进性能。LeNet-5是他们的代表性工作，它开启了CNN在计算机视觉领域的广泛应用。然而，直到2006年，由于计算资源的限制和浅层学习算法的崛起，CNN的研究经历了一段低谷。Hinton等人的工作重新激发了对深度学习的兴趣，CNN再次成为研究的焦点。后续的研究者如Krizhevsky等人进一步改进了CNN，例如AlexNet，这在2012年的ImageNet挑战赛上取得了显著的突破，证明了深度CNN在大规模图像分类任务上的优势。随着计算能力的提升和大数据集的出现，CNN得以进一步发展，包括VGGNet、GoogLeNet和ResNet等更深层次、更复杂的网络结构相继出现，它们不仅提高了模型的准确性，还解决了训练深层网络时可能出现的梯度消失问题。此外，CNN也被应用于语音识别、自然语言处理、推荐系统等多个领域，展现出强大的泛化能力和适应性。卷积神经网络是现代计算机视觉和深度学习的核心组成部分，它的理论和技术不断发展，为人工智能的进步做出了重大贡献。从最初的LeNet-5到现在的各种高级变体，CNN一直在推动着图像理解和模式识别的边界。随着技术的持续创新，我们有理由相信CNN将在未来的科技发展中发挥更加关键的作用。

2.2.1 卷积层〔The convolutional layer〕

1、局部感知

卷积神经网络有两种神器可以降低参数数目，第一种神器叫做局部感知野。

一般认为人对外界的认知是从局部到全局的，而图像的空间联系也是局部的像

素联系较为紧密，而距离较远的像素相关性那么较弱。因而，每个神经元其实

没有必要对全局图像进行感知，只需要对局部进行感知，然后在更高层将局部

的信息综合起来就得到了全局的信息。网络局部连通的思想，也是受启发于生

物学里面的视觉系统结构。视觉皮层的神经元就是局部接受信息的〔即这些神

经元只响应某些特定区域的刺激〕。如下列图所示：左图为全连接，右图为局部

连接。

在上右图中，假设每个神经元只和它前一层邻近的 10×10 个像素值相连，那

么权值数据为 1000000×100 个参数，减少为原来的万分之一。而那 10×10 个像

素值对应的 10×10 个参数，其实就相当于卷积操作。

2、权值共享

但其实这样的话参数仍然过多，那么就启动第二级神器，即权值共享。在上

面的局部连接中，每个神经元都对应 100 个参数，一共 1000000 个神经元，如

果这 1000000 个神经元的 100 个参数都是相等的，那么参数数目就变为 100 了。

怎么理解权值共享呢？我们可以这 100 个参数〔也就是卷积操作〕看成是提

取特征的方式，该方式与位置无关。这其中隐含的原理那么是：图像的一局部

的统计特性与其他局部是一样的。这也意味着我们在这一局部学习的特征也能

用在另一局部上，所以对于这个图像上的所有位置，我们都能使用同样的学习

特征。

更直观一些，当从一个大尺寸图像中随机选取一小块，比方说 8×8 作为样

本，并且从这个小块样本中学习到了一些特征，这时我们可以把从这个 8×8 样

本中学习到的特征作为探测器，应用到这个图像的任意地方中去。特别是，我

们可以用从 8×8 样本中所学习到的特征跟原本的大尺寸图像作卷积，从而对这

个大尺寸图像上的任一位置获得一个不同特征的激活值。

如下列图所示，展示了一个 3×3 的卷积核在 5×5 的图像上做卷积的过程。每

个卷积都是一种特征提取方式，就像一个筛子，将图像中符合条件的局部筛选

出来。

〔图片为 gif 格式〕

3、多卷积核

上面所述只有 100 个参数时，说明只有 1 个 10×10 的卷积核，显然，特征提

取是不充分的，我们可以添加多个卷积核，比方 32 个卷积核，可以学习 32 种

特征。在有多个卷积核时，如下列图所示：

上图右，不同颜色说明不同的卷积核。每个卷积核都会将图像生成为另一幅

图像。比方两个卷积核就可以将生成两幅图像，这两幅图像可以看做是一张图

像的不同的通道，如下列图所示。

下列图展示了在四个通道上的卷积操作，有两个卷积核，生成两个通道。其

中需要注意的是，四个通道上每个通道对应一个卷积核，先将𝑊

忽略，只看𝑊

，

那么在𝑊

的某位置(𝑖, 𝑗)处的值，是由四个通道上(𝑖, 𝑗)处邻近区域的卷积结果相

加然后再取激活函数〔假设选择 tanh 函数〕值得到的。

剩余21页未读，继续阅读

xxpr_ybgg

粉丝: 6820

卷积神经网络CNN的发展与应用

Get清风卷积神经网络CNN (3).pdf

卷积神经网络cnn python代码

openmv卷积神经网络训练程序

get清风数控铣床笑脸、五角星、八卦程序.pdf

plt保存图片_人工智能Keras CNN卷积神经网络的图片识别模型训练

**** 问题的卷积神经网络算法实现

卷积神经网络代码

使用PyTorch实现一个简单的卷积神经网络（CNN），用于识别手写数字（使用MNIST数据集）。

贝叶斯优化卷积神经网络的目标函数以及贝叶斯优化卷积神经网络分类预测的matlab代码咋写

db.spider(self.city.get(),self.year.get(),self.month.get())是什么意思

最新资源