深度学习笔记：卷积神经网络详解

124 浏览量更新于2024-08-30 收藏 246KB PDF 举报

"本文是动手学深度学习的学习笔记，主要探讨了卷积神经网络的基础，包括二维卷积层和池化层，以及相关的概念如填充、步幅、输入通道和输出通道。通过实例介绍了二维互相关运算的实现，并定义了一个简单的二维卷积层类。" 在深度学习中，卷积神经网络（Convolutional Neural Networks, CNN）是处理图像等高维数据的核心模型。本篇学习笔记重点讲述了CNN的基础知识，首先是卷积层和池化层。卷积层是CNN的核心组成部分，它的主要功能是对输入数据进行特征提取。在二维卷积层中，数据通常是二维的，例如图像，由多个像素点组成。卷积层通过二维互相关运算来处理这些数据。二维互相关运算是一种特殊的运算方式，其中输入是一个二维数组（如图像），卷积核（或称过滤器）是另一个小的二维数组。卷积核在输入数组上滑动，对每个位置上的输入子数组与卷积核进行逐元素乘法后求和，形成输出数组的一个元素。这个过程可以有效地捕捉输入数据的空间关系，发现局部特征。卷积层的一些关键参数包括： 1. **填充（Padding）**：在输入数组边缘添加额外的零，以保持输出尺寸与输入尺寸一致或按照预设比例调整。 2. **步幅（Stride）**：卷积核在输入数组上移动的步长，决定了输出的分辨率。 3. **输入通道（Input Channels）**：对应于输入数据的颜色通道，例如RGB图像有三个通道。 4. **输出通道（Output Channels）**：表示卷积层能够检测到的不同特征的数量，每个通道对应一组卷积核。为了更直观地理解二维互相关运算，文中提供了一个示例，通过Python的PyTorch库实现了一个名为`corr2d`的函数，演示了如何对输入数组`X`和卷积核`K`进行二维互相关运算。然后，通过创建一个简单的二维卷积层类`Conv2D`，展示了卷积层如何结合权重和偏置生成输出。此外，文中提到的leNet是最早的卷积神经网络之一，用于识别手写数字，它奠定了现代卷积神经网络的基础。卷积神经网络的进阶部分可能包括更复杂的网络架构，如更深的网络层次、激活函数、批量归一化、dropout等技术，这些技术有助于提升模型性能和防止过拟合。这篇学习笔记提供了对卷积神经网络基本原理的深入理解和实践，对于初学者来说是深入理解深度学习，特别是图像处理领域的重要参考资料。通过学习这些基础知识，读者可以为进一步探索更高级的CNN架构和应用打下坚实的基础。

动手学深度学习动手学深度学习-学习笔记（五）学习笔记（五）

本文的主要内容有：：卷积神经网络基础；leNet；卷积神经网络进阶

一、卷积神经网络基础一、卷积神经网络基础

本节我们介绍卷积神经网络的基础概念，主要是卷积层和池化层，并解释填充、步幅、输入通道和输出通道的含义。

二维卷积层二维卷积层

本节介绍的是最常见的二维卷积层，常用于处理图像数据。

二维互相关运算二维互相关运算

二维互相关（cross-correlation）运算的输入是一个二维输入数组和一个二维核（kernel）数组，输出也是一个二维数组，其中核数组通常称为卷积核或过滤器（filter）。卷积核的

尺寸通常小于输入数组，卷积核在输入数组上滑动，在每个位置上，卷积核与该位置处的输入子数组按元素相乘并求和，得到输出数组中相应位置的元素。图1展示了一个互相关

运算的例子，阴影部分分别是输入的第一个计算区域、核数组以及对应的输出。

图1 二维互相关运算

下面我们用corr2d函数实现二维互相关运算，它接受输入数组X与核数组K，并输出数组Y。

import torch

import torch.nn as nn

def corr2d(X, K):

H, W = X.shape

h, w = K.shape

Y = torch.zeros(H - h + 1, W - w + 1)

for i in range(Y.shape[0]):

for j in range(Y.shape[1]):

Y[i, j] = (X[i: i + h, j: j + w] * K).sum()

return Y

构造上图中的输入数组X、核数组K来验证二维互相关运算的输出。

X = torch.tensor([[0, 1, 2], [3, 4, 5], [6, 7, 8]])

K = torch.tensor([[0, 1], [2, 3]])

Y = corr2d(X, K)

print(Y)

tensor([[19., 25.],

[37., 43.]])

二维卷积层二维卷积层

二维卷积层将输入和卷积核做互相关运算，并加上一个标量偏置来得到输出。卷积层的模型参数包括卷积核和标量偏置。

class Conv2D(nn.Module):

def __init__(self, kernel_size):

super(Conv2D, self).__init__()

self.weight = nn.Parameter(torch.randn(kernel_size))

self.bias = nn.Parameter(torch.randn(1))

def forward(self, x):

return corr2d(x, self.weight) + self.bias

下面我们看一个例子，我们构造一张6×86 imes 86×8的图像，中间4列为黑（0），其余为白（1），希望检测到颜色边缘。我们的标签是一个6×76 imes 76×7的二维数组，第2

列是1（从1到0的边缘），第6列是-1（从0到1的边缘）。

X = torch.ones(6, 8)

Y = torch.zeros(6, 7)

X[:, 2: 6] = 0

Y[:, 1] = 1

Y[:, 5] = -1

print(X)

print(Y)

tensor([[1., 1., 0., 0., 0., 0., 1., 1.],

[1., 1., 0., 0., 0., 0., 1., 1.],

[1., 1., 0., 0., 0., 0., 1., 1.]])

tensor([[ 0., 1., 0., 0., 0., -1., 0.],

[ 0., 1., 0., 0., 0., -1., 0.],

[ 0., 1., 0., 0., 0., -1., 0.]])

我们希望学习一个1×21 imes 21×2卷积层，通过卷积层来检测颜色边缘。

conv2d = Conv2D(kernel_size=(1, 2))

step = 30

lr = 0.01

for i in range(step):

Y_hat = conv2d(X)

l = ((Y_hat - Y) ** 2).sum()

l.backward()

# 梯度下降

conv2d.weight.data -= lr * conv2d.weight.grad

conv2d.bias.data -= lr * conv2d.bias.grad

# 梯度清零

conv2d.weight.grad.zero_()

conv2d.bias.grad.zero_()

if (i + 1) % 5 == 0:

print('Step %d, loss %.3f' % (i + 1, l.item()))

下载后可阅读完整内容，剩余5页未读，立即下载

weixin_38706951

粉丝: 4
资源: 930

深度学习笔记：卷积神经网络详解

深度学习笔记：机器翻译与神经网络架构

深度学习笔记：代码与数据全面解析

深度学习实践：李沐老师的Pytorch代码笔记

《动手学深度学习》-小白笔记四

动手学深度学习-很详细的基础教程

[深度学习]动手学深度学习笔记-6

[深度学习]动手学深度学习笔记-8

动手学深度学习PyTorch版学习笔记2

动手学深度学习Pytorch版本学习笔记 Task 03

动手学深度学习Pytorch版本学习笔记 Task4

最新资源