卷积神经网络(CNN)详解：从历史到现代

需积分: 0 84 浏览量更新于2024-07-01 收藏 2.41MB PDF 举报

"CNN全解1" 卷积神经网络(CNN)是深度学习领域中的核心模型，主要用于图像识别、计算机视觉任务。CNN的设计灵感来源于生物视觉系统，尤其是神经元的局部感受野特性。自1968年Hubel和Wiesel的研究以来，这种局部连接和权重共享的概念逐渐被引入到人工神经网络中，最终发展成现代的CNN。 1. CNN的历史与发展 - Hubel和Wiesel的工作揭示了视觉皮层神经元对特定视野小区域的敏感性，这为CNN的局部感知特性奠定了理论基础。 - 1980年，Fukushima的神经感知机(neocognitron)引入了层次化的特征检测，是卷积概念在神经网络的初步应用。 - 1988年的时不变神经网络进一步增强了网络的位移不变性，提高了物体识别能力。 - 2005年，GPU实现CNN的论文推动了CNN的计算效率，而2012年ImageNet大赛中AlexNet的胜利则确立了CNN在深度学习中的主导地位。 1. CNN的结构与特点 - 输入层：接收原始图像数据。 - 卷积层：通过卷积核对输入图像进行扫描，提取特征，每个核对应一种特征。 - 激活层（如ReLU）：引入非线性，提高模型表达能力。 - 池化层（如Max Pooling）：降低维度，减少计算量，保持位置信息。 - 全连接层：将前面的特征映射连接到分类层，进行最终的分类决策。 2. CNN的关键特性 - 局部感知：每个神经元仅与其覆盖范围内的输入单元连接，降低了参数数量。 - 权重共享：同一卷积核在所有位置上使用相同的权重，进一步减少了参数。 - 多卷积核：不同卷积核捕捉不同特征，形成多层次的特征表示。 3. 训练过程 - 定义损失函数（如交叉熵损失）来评估模型预测与真实结果的差异。 - 使用优化算法（如随机梯度下降SGD）更新权重和偏置以最小化损失函数。 - 反向传播计算梯度，权重和偏置更新遵循梯度方向。 - 在训练集上迭代多次，直至损失函数收敛或达到预设训练轮数。 4. CNN的应用 - 图像分类：识别图像中的物体类别。 - 目标检测：定位并识别图像中的多个目标。 - 语义分割：为图像的每个像素分配类别标签。 - 除了图像任务，CNN也被用于自然语言处理中的文本分类和序列标注。 CNN的这些特性使得它在处理复杂图像数据时表现出色，尤其是在大规模图像识别任务中。随着技术的不断发展，CNN与其他深度学习模型的融合（如RNN、Transformer等）也日益普遍，为各种应用场景提供了更强大的工具。

去均值与归一化效果图

传统的神经网络的参数量是非常巨大的，比如1000 * 1000像素的图片，映射到和自己相同的大小，需要（1000 *

1000）的平方，也就是10的12次方个参数，参数量太大了，而CNN除全连接层外，卷积层的参数完全取决于滤波器

的设置大小，比如10 * 10的滤波器，这样只有100个参数，当然滤波器的个数不止一个，也就是下面要说的多卷积

核。但与传统的神经网络相比，参数量小，计算量小。整个图片共享一组滤波器的参数。



3）CNN特点之多卷积核：

一种卷积核代表的是一种特征，为获得更多不同的特征集合，卷积层会有多个卷积核，生成不同的特征，这也是为什

么卷积后的图片有高度，每一个图片代表不同的特征。



2. CNN网络结构

卷积神经网络的层级结构



2.1 数据输入层

该层可能要做的主要是对原始图像数据进行预处理，其中包括



• 数据输入层/ Input layer

• 卷积计算层/ CONV layer

• ReLU激励层 / ReLU layer

• 池化层 / Pooling layer

• 全连接层 / FC layer

• 去均值：把输入数据各个维度都中心化为0，如下图所示，其目的就是把样本的中心拉回到坐标系原点上

• 归一化：幅度归一化到同样的范围，如下所示，即减少各维度数据取值范围的差异而带来的干扰，比如，我们有两个维

度的特征A和B，A范围是0到10，而B范围是0到10000，如果直接使用这两个特征是有问题的，好的做法就是归一化，

即A和B的数据都变为0到1的范围

• PCA/白化：用PCA降维；白化是对数据各个特征轴上的幅度归一化

剩余19页未读，继续阅读

大禹倒杯茶

粉丝: 23
资源: 331

卷积神经网络(CNN)详解：从历史到现代

CNN基础入门

CNN入门介绍

CNN基本入门总结（归纳）下

2D CNN与1D CNN有什么区别？

CNN2网络相较于CNN1网络优势

cnn fast-cnn faster-cnn

一维卷积神经网络(cnn-1d)结合lstm,第二个模型为一维卷积神经网络(cnn-1d)结合gru

from CNN import CNN

分析这段代码cnn2 = add([cnn11,cnn12])，cnn2的shape和cnn11，cnn12的shape一样吗

R-CNN、fast-R-CNN、faster-R-CNN、mask-R-CNN介绍

最新资源