深度学习基础：卷积神经网络中的互相关运算与卷积层解析

需积分: 0 190 浏览量更新于2024-08-29 收藏 355KB PDF 举报

"Day5 - 介绍卷积神经网络的基础知识，包括二维互相关运算和卷积层，以及填充和步幅的概念" 卷积神经网络（Convolutional Neural Networks，CNN）是深度学习领域中用于图像识别和处理的核心技术。本节主要探讨其基本构成和运算原理。 1、二维互相关运算与卷积层二维互相关运算是一种在图像处理和神经网络中广泛使用的操作。它涉及到两个数组：一个二维输入数组（通常是图像数据）和一个二维核（或称卷积核、过滤器）。卷积核在输入数组上滑动，对每个位置的输入子数组与卷积核进行逐元素相乘并求和，结果存储在输出数组的相应位置。这种运算方式有助于捕捉输入数据中的局部特征。卷积层是构建CNN的基本单元，它通过应用二维互相关运算来提取输入数据的特征。卷积层的输出不仅包含互相关运算的结果，还加入了一个标量偏置，使得模型能够学习更复杂的模式。尽管术语“卷积”常被用来描述这种运算，但实际上卷积层使用的是互相关运算，因为卷积核是可学习的，所以互相关与卷积的区别可以忽略不计。 2、填充和步幅填充（padding）是为了保持输出尺寸不变或者调整输出尺寸而对输入边缘添加额外元素（通常是0）。例如，对于3x3的卷积核，若设置合适的填充，可以在步幅为1的情况下保持输入和输出的尺寸相同。填充可以帮助捕捉边界信息，避免特征检测仅集中在输入的中心部分。步幅（stride）决定了卷积核在输入上移动的步长。步幅越大，输出的尺寸越小，模型捕捉的局部特征数量减少，但计算效率提高。反之，步幅越小，输出尺寸越大，模型能够捕获更多细节，但计算量增加。通常，步幅为1意味着卷积核在每个位置都会进行一次运算。综合填充和步幅，可以灵活地控制输出形状，以适应不同的应用场景和性能需求。例如，当填充等于卷积核大小减1时，输出形状简化为输入形状除以步幅。如果输入尺寸能被步幅整除，输出形状则直接是输入形状除以步幅的整数值。总结来说，卷积神经网络通过卷积层的互相关运算、适当的填充和步幅来提取图像数据的特征，这些基础概念是理解和构建CNN模型的关键。了解这些原理后，我们可以进一步探索池化层、激活函数、全连接层等CNN的其他组成部分，以及如何优化和训练这些网络以解决实际问题。

Day5

一、卷积神经网络基础一、卷积神经网络基础

1、互相关运算与卷积层

我们先来看一下具体运算过程（以二维运算为例）

（1）二维互相关运算

二维互相关（cross-correlation）运算的输入是一个二维输入数组和一个二维核（kernel）数组，输出也是一个二维数组，其中核数组通常称为卷积核或

过滤器（filter）。卷积核的尺寸通常小于输入数组，卷积核在输入数组上滑动，在每个位置上，卷积核与该位置处的输入子数组按元素相乘并求和，得

到输出数组中相应位置的元素。图1展示了一个互相关运算的例子，阴影部分分别是输入的第一个计算区域、核数组以及对应的输出。

（2）二维卷积层

二维卷积层将输入和卷积核做互相关运算，并加上一个标量偏置来得到输出。卷积层的模型参数包括卷积核和标量偏置。

卷积层得名于卷积运算，但卷积层中用到的并非卷积运算而是互相关运算。我们将核数组上下翻转、左右翻转，再与输入数组做互相关运算，这一过程

就是卷积运算。由于卷积层的核数组是可学习的，所以使用互相关运算与使用卷积运算并无本质区别。

2、填充和步幅

（1）填充

填充（padding）是指在输入高和宽的两侧填充元素（通常是0元素），图2里我们在原输入高和宽的两侧分别添加了值为0的元素。

如果原输入的高和宽是 nh 和 nw ，卷积核的高和宽是 kh 和 kw ，在高的两侧一共填充 ph 行，在宽的两侧一共填充 pw 列，则输出形状为：

(nh+ph−kh+1)×(nw+pw−kw+1)

我们在卷积神经网络中使用奇数高宽的核，比如 3×3 ， 5×5 的卷积核，对于高度（或宽度）为大小为 2k+1 的核，令步幅为1，在高（或宽）两侧选择

大小为 k 的填充，便可保持输入与输出尺寸相同。

（2）步幅

在互相关运算中，卷积核在输入数组上滑动，每次滑动的行数与列数即是步幅（stride）。此前我们使用的步幅都是1，图3展示了在高上步幅为3、在宽

上步幅为2的二维互相关运算。

一般来说，当高上步幅为 sh ，宽上步幅为 sw 时，输出形状为：

⌊(nh+ph−kh+sh)/sh⌋×⌊(nw+pw−kw+sw)/sw⌋

如果 ph=kh−1 ， pw=kw−1 ，那么输出形状将简化为 ⌊(nh+sh−1)/sh⌋×⌊(nw+sw−1)/sw⌋ 。更进一步，如果输入的高和宽能分别被高和宽上的步幅整除，

那么输出形状将是 (nh/sh)×(nw/sw) 。

当 ph=pw=p 时，我们称填充为 p ；当 sh=sw=s 时，我们称步幅为 s 。

3、卷积层与全连接层的对比

卷积层所需参数远远少于全连接层

4、池化

加入池化层，主要是用于缓解卷积层对位置的过度敏感性。

二、二、LeNet

LeNet分为卷积层块和全连接层块两个部分。

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38669618

粉丝: 7
资源: 912

深度学习基础：卷积神经网络中的互相关运算与卷积层解析

Node.js进阶教程：day5实践与总结

JavaSE就业班Day5：Object类、equals与toString方法详解及异常处理

iOS8每日教程：Swift入门与扩展开发

AS400学习day1-day5

AS400学习DAY1-DAY5

FiaW_Day5_ProjectArchive

day5 java笔记.md

FiaW_Day5_ProjectArchive 002

华为鲲鹏day5 rip.rar

day5_列表嵌套.py

最新资源