深度解析：卷积神经网络（CNN）的工作原理

103 浏览量更新于2024-08-31 收藏 699KB PDF 举报

"AI学习笔记——卷积神经网络（CNN）" 卷积神经网络（CNN）是一种专门用于处理具有网格状结构数据，如图像、声音或时间序列等的深度学习模型。在CNN中，卷积层是核心组成部分，它通过滤波器（Filter）来提取特征，从而减少了对全连接层的依赖，降低了模型复杂度。卷积(Convolution)：卷积操作是CNN的基础，它使用滤波器在输入图像上滑动并应用权重运算。滤波器通常是一个小的多维数组，例如3x3或5x5，它在输入图像上逐行逐列地移动，每次移动称为一个步长（Stride）。在每个位置，滤波器与输入图像的部分区域（也称为感受野）进行点乘运算，然后将结果求和，加上偏置项，得到该位置的输出值。这样，滤波器在输入上滑动并计算出新的特征映射，形成了输出层的图像。填充(Padding)：为了保持输出图像的尺寸与输入图像相同，可以使用填充技术。在输入图像的边缘添加额外的像素（通常是0），使得滤波器在覆盖输入图像时，能够覆盖到边缘，从而保持输出尺寸不变。步长(Stride)：步长决定了滤波器在输入图像上移动的距离。较大的步长会减少计算量，但可能丢失某些细节信息；较小的步长则能捕获更多局部信息，但会增加计算复杂度。深度(Depth)：深度指的是输出特征图的通道数。在处理彩色图像时，原始输入可能包含多个通道（如RGB的3个通道）。滤波器也对应有相同的通道数，对每个通道进行卷积，生成的输出特征图也具有相同数量的通道。因此，如果一个3x3x3的滤波器应用于6x6x3的输入图像，可能会产生一个4x4x1的输出，这里的1表示输出特征图的深度。池化(Pooling)：除了卷积，CNN还常使用池化层来进一步降低数据维度，提高模型的鲁棒性。常见的池化操作有最大池化和平均池化，它们在小区域内选择最大值或平均值作为输出。激活函数(Activation Function)：激活函数如ReLU（Rectified Linear Unit）为网络引入非线性，使得模型能够学习更复杂的特征。全连接层(Fully Connected Layer)：虽然CNN主要依赖于卷积和池化层，但在最后，通常会接一个或多个全连接层，用于分类或回归任务。全连接层中的每个神经元都连接到前一层的所有神经元，形成一个密集的连接网络。训练与优化： CNN的训练过程包括反向传播和梯度下降，通过调整滤波器的权重来最小化损失函数，通常使用Adam、SGD等优化算法。总结：卷积神经网络（CNN）通过卷积、池化、激活函数以及全连接层等组件，有效地从输入数据中提取特征，特别适用于图像识别和计算机视觉任务。理解这些基本概念是深入研究和应用CNN的关键。

AI学习笔记学习笔记——卷积神经网络（卷积神经网络（CNN））

上篇文章简单地地介绍了神经网络和深度学习，在神经网络中，每一层的每个神经元都与下一层的每个神经元相连(如下图)，

这种连接关系叫全连接（Full Connected）。如果以图像识别为例，输入就是是每个像素点，那么每一个像素点两两之间的关

系(无论相隔多远)，都被下一层的神经元"计算"了。

这种全连接的方法用在图像识别上面就显得太"笨"了，因为图像识别首先得找到图片中各个部分的"边缘"和"轮廓"，而"边

缘"和"轮廓"只与相邻近的像素们有关。

这个时候卷积神经网络(CNN)就派上用场了，卷积神经网络可以简单地理解为，用滤波器(Filter)将相邻像素之间的"轮廓"过滤

出来。

卷积(Convolution)

卷积的滤波器（Filter）是如何工作的呢？以下图，一个6x6的图片被一个3x3的滤波器（可以看成一个窗口）卷积为例，3x3

的滤波器先和6x6的图片最左上角的3x3矩阵卷积得到结果后，再向右移一步继续卷积（窗口滑动），直到将整个图片过滤完

成，输出一个4x4的矩阵(图片)。

这样有什么意义呢？如果如下图所示，被卷积的图片有明显的竖直轮廓（10和0之间有一轮廓，这条轮廓需要被标记出来），

用3x3的竖直轮廓滤波器卷积之后，就能发现中间那条非常明显的竖直轮廓（中间30的两个竖排矩阵将竖直的轮廓位置明显地

标记了出来）。

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38589168

粉丝: 7

深度解析：卷积神经网络（CNN）的工作原理

Deeplearning.ai CNN And Sequence

(完整版)深度神经网络及目标检测学习笔记 (2).pdf

人工智能实践：TensorFlow笔记学习（一）——人工智能概述.pdf

卷积神经网络（CNN）详解：图像识别的利器

斯坦福大学CS231n：卷积神经网络视觉识别

深度学习笔记

李飞飞深度学习笔记作业

MachineLearning_机器学习笔记_

Deeplearning深度学习笔记v5.6.zip

李飞飞——计算机视觉——斯坦福CS231.rar

最新资源