深度学习实践：CNN模型与卷积层解析

3 浏览量更新于2024-08-30 收藏 1.06MB PDF 举报

"这篇文档是关于深度学习入门的笔记，主要关注卷积神经网络（CNN）模型及其进阶应用。作者通过代码实例介绍了卷积的基本操作——二维互相关，然后构建了一个简单的二维卷积层，并用梯度下降法进行训练。" 深度学习是一种模拟人脑神经网络的机器学习技术，特别适用于图像、语音等复杂数据的处理。在深度学习中，卷积神经网络（CNN）起着至关重要的作用，尤其在计算机视觉领域。CNN模型因其对局部特征的高效提取能力而闻名。 ### 二维互相关二维互相关是卷积的基础，它计算的是输入矩阵X和滤波器（或称卷积核）K之间的相似性。在给定的代码中，`corr2d`函数执行了这个操作。对于每一个位置(i, j)，函数计算了X[i:i+h, j:j+w]子矩阵与K的乘积之和，然后将结果存放在输出矩阵Y的对应位置。这里的(h, w)是卷积核的尺寸。 ### 二维卷积层在深度学习框架中，如PyTorch，通常会用`nn.Conv2d`构建二维卷积层。然而，为了理解原理，作者定义了一个自定义的`Conv2D`类，其中`forward`方法实现了二维互相关运算，并加上了一个标量偏置。权重`weight`和偏置`bias`都是模型的参数，可以通过反向传播更新。 ### 训练过程作者给出的例子展示了如何训练一个简单的二维卷积层。他们创建了一个输入X和目标输出Y，然后初始化了卷积层。通过梯度下降法，每一步更新权重和偏置以最小化损失函数，即预测输出`Y_hat`与真实输出`Y`之间的平方差之和。在每个更新周期后，梯度被清零以防止梯度消失问题。 ### 进阶模型虽然这篇笔记主要集中在基础的二维卷积，但卷积神经网络可以包含多个卷积层、池化层、激活函数（如ReLU）、全连接层等，构成复杂的深度架构。这样的模型能够学习更高级别的特征，从而在图像分类、物体检测等任务中取得优秀性能。总结来说，这篇笔记提供了对深度学习中卷积神经网络基本概念和实现的直观理解，为初学者提供了动手实践的起点。通过理解和实现这些基本操作，读者可以进一步探索更复杂的深度学习模型和算法。

动手入门深度学习笔记动手入门深度学习笔记-CNN模型以及进阶模型模型以及进阶模型

CNN模型模型

code实现实现

## 二维互相关

import torch

import torch.nn as nn

def corr2d(X, K):

H, W = X.shape

h, w = K.shape

Y = torch.zeros(H - h + 1, W - w + 1)

for i in range(Y.shape[0]):

for j in range(Y.shape[1]):

Y[i, j] = (X[i: i + h, j: j + w] * K).sum()

return Y

X = torch.tensor([[0, 1, 2], [3, 4, 5], [6, 7, 8]])

K = torch.tensor([[0, 1], [2, 3]])

Y = corr2d(X, K)

print(Y)

## 二维卷积层

#二维卷积层将输入和卷积核做互相关运算，并加上一个标量偏置来得到输出。卷积层的模型参数包括卷积核和标量偏置

class Conv2D(nn.Module):

def __init__(self, kernel_size):

super(Conv2D, self).__init__()

self.weight = nn.Parameter(torch.randn(kernel_size))

self.bias = nn.Parameter(torch.randn(1))

def forward(self, x):

return corr2d(x, self.weight) + self.bias

## 例子

X = torch.ones(6, 8)

Y = torch.zeros(6, 7)

X[:, 2: 6] = 0

Y[:, 1] = 1

Y[:, 5] = -1

print(X)

print(Y)

conv2d = Conv2D(kernel_size =(1,2))

step = 30

lr = 0.01

for i in range(step):

Y_hat = conv2d(X)

l = ((Y_hat - Y)**2).sum()

l.backward()

# 梯度下降

conv2d.weight.data -= lr * conv2d.weight.grad

conv2d.bias.data -= lr * conv2d.bias.grad

# 梯度清零

conv2d.weight.grad.zero_()

conv2d.bias.grad.zero_()

if (i + 1) % 5 == 0:

print('Step %d, loss %.3f' % (i + 1, l.item()))

print(conv2d.weight.data)

print(conv2d.bias.data)

## 将核数组上下翻转，左右翻转在与输入组做互相关运算这一过程叫做卷积运算

## 特征图与感受野定义

"""

二维卷积层输出的二维数组可以看作是输入在空间维度（宽和高）上某一级的表征，

也叫特征图（feature map）。影响元素的前向计算的所有可能输入区域

(可能大于输入的实际尺寸）叫做的感受野（receptive field）

"""

### 填充和步幅

"""

填充指的是在输入高和宽的两侧填充元素

步幅:卷积和在输入数组上滑动每次滑动的行数与列数即为步幅

"""

## 多输入通道和多输出通道

"""

我们将大小为3的这一维称为通道维

"""

## 二维卷积层与全连接层对比

"""

二维卷积层常用于处理图像有两个优势

1:全连接层把图像展平成一个向量在输入图像上相邻的元素可能因为展平操作不再相邻网络难以捕捉局部信息

而卷积层的设计天然地具有提取局部信息的能力

2:卷积层的参数量更少

"""

X = torch.rand(4,2,3,5)

print(X.shape)

conv2d = nn.Conv2d(in_channels = 2,out_channels = 3,kernel_size=(3,5),stride = 1,padding = (1,2))

Y = conv2d(X)

print('Y.shape: ', Y.shape)

print('weight.shape: ', conv2d.weight.shape)

print('bias.shape: ', conv2d.bias.shape)

## 池化

"""

池化层主要是计算池化窗口内元素的最大值或平均值

池化层的输出通道道数和输入通道数相等

"""

下载后可阅读完整内容，剩余9页未读，立即下载

weixin_38699551

粉丝: 4
资源: 909

深度学习实践：CNN模型与卷积层解析

建立的简单的CNN_model模型，是python类型的程序代码

CNN代码和模型.zip

CNN_源代码

深度学习：其中包含我的深度学习课程的入门笔记本

吴恩达深度学习笔记

吴恩达深度学习DeepLearning-详细中文和英文笔记总结以及知识图谱三剑客

Deep_learning:我的深度学习笔记和示例

李飞飞深度学习中文笔记完整版

机器学习学习笔记.zip

Udacity_Tensorflow_Tutorials：我在跟随Udacity的“深度学习Tensorflow入门”课程时编写的神经网络

最新资源