探索DataWhale学习营：二维卷积神经网络详解与实战

196 浏览量更新于2024-08-29 收藏 365KB PDF 举报

卷积神经网络基础是深度学习中的一种关键组件，特别是在处理图像和视频数据时，其效率和效果尤为显著。本节重点讨论了二维卷积层，这是卷积神经网络中最常见的结构，专门针对图像数据进行特征提取和表示学习。二维卷积层的核心概念是二维互相关运算。这种运算涉及到两个二维数组，一个是输入数组（通常代表图像的像素矩阵），另一个是卷积核（或过滤器）。卷积核是一个较小的矩阵，它在输入数组上进行滑动操作，每次与输入数组中的一部分（称为子数组）进行点乘并求和，从而生成输出数组中对应位置的值。这个过程可以视为对输入数据的局部特征检测，因为卷积核只关注局部区域的信息。 `corr2d`函数演示了如何在PyTorch中实现二维互相关运算。它接受输入数组`X`和卷积核`K`，通过循环遍历计算出每个位置的卷积结果，并将结果填充到输出数组`Y`中。例如，给定输入数组`X`和核数组`K`，经过`corr2d`函数处理后，可以看到输出数组的特定结果。在实际应用中，二维卷积层作为`nn.Conv2d`类的一个实例，它包含权重（即卷积核）和偏差项。`nn.Conv2d`模块初始化时，会创建随机权重和偏置，这两个参数是模型的可学习参数。在`forward`方法中，输入数据`x`与卷积核进行卷积运算，再加上偏置，最终得到卷积层的输出。例如，一个`Conv2D`层可能有`kernel_size`参数，如`(3, 3)`，表示卷积核的大小。当我们创建这样的层并传入数据时，它会自动执行卷积操作，为图像处理任务提供了强大的基础结构。通过堆叠多个卷积层，我们可以逐渐提取出更高级别的特征，如边缘、纹理和对象的部分形状，从而为后续的分类、识别等任务提供信息。总结起来，二维卷积层是卷积神经网络的基础组成部分，它通过二维互相关运算提取图像数据的局部特征，通过学习调整的卷积核参数，实现对输入数据的高效分析和处理。理解这些概念对于深入学习计算机视觉、图像分类和深度学习框架如PyTorch至关重要。

DataWhale组队打卡学习营组队打卡学习营task05-1 卷积神经网络基础卷积神经网络基础

卷积神经网络基础卷积神经网络基础

二维卷积层二维卷积层

本节介绍的是最常见的二维卷积层，常用于处理图像数据。

二维互相关运算

二维互相关（cross-correlation）运算的输入是一个二维输入数组和一个二维核（kernel）数组，输出也是一个二维数组，其中核数组通

常称为卷积核或过滤器（filter）。卷积核的尺寸通常小于输入数组，卷积核在输入数组上滑动，在每个位置上，卷积核与该位置处的输

入子数组按元素相乘并求和，得到输出数组中相应位置的元素。图1展示了一个互相关运算的例子，阴影部分分别是输入的第一个计算

区域、核数组以及对应的输出。

图1 二维互相关运算

下面我们用corr2d函数实现二维互相关运算，它接受输入数组X与核数组K，并输出数组Y。

import torch

import torch.nn as nn

def corr2d(X, K):

H, W = X.shape

h, w = K.shape

Y = torch.zeros(H - h + 1, W - w + 1)

for i in range(Y.shape[0]):

for j in range(Y.shape[1]):

Y[i, j] = (X[i: i + h, j: j + w] * K).sum()

return Y

构造上图中的输入数组X、核数组K来验证二维互相关运算的输出。

X = torch.tensor([[0, 1, 2], [3, 4, 5], [6, 7, 8]])

K = torch.tensor([[0, 1], [2, 3]])

Y = corr2d(X, K)

print(Y)

tensor([[19., 25.],

[37., 43.]])

二维卷积层

二维卷积层将输入和卷积核做互相关运算，并加上一个标量偏置来得到输出。卷积层的模型参数包括卷积核和标量偏置。

class Conv2D(nn.Module):

def __init__(self, kernel_size):

super(Conv2D, self).__init__()

self.weight = nn.Parameter(torch.randn(kernel_size))

self.bias = nn.Parameter(torch.randn(1))

def forward(self, x):

return corr2d(x, self.weight) + self.bias

下面我们看一个例子，我们构造一张68

的图像，中间

列为黑（

），其余为白（

），希望检测到颜色边缘。我们的标签是一个

67的二

维数组，第2列是1（从1到0的边缘），第6列是-1（从0到1的边缘）。

X = torch.ones(6, 8)

Y = torch.zeros(6, 7)

X[:, 2: 6] = 0

Y[:, 1] = 1

Y[:, 5] = -1

print(X)

print(Y)

下载后可阅读完整内容，剩余5页未读，立即下载

weixin_38696339

粉丝: 4
资源: 908

探索DataWhale学习营：二维卷积神经网络详解与实战

Datawhale 组队学习打卡营 任务13：卷积神经网络基础

BP神经网络通用图，注意事项有：3层网络，输入12个姓名，输出4个组队

deg inv sqrt

给出matlab代码，生成BP神经网络通用图，注意事项有：3层网络，输入12个姓名，输出4个组队

data_train = pd.read_csv

vue+springboot组队功能

最优组队问题matlab

导航中组队背景业务介绍

h5 对人组队游戏 源码

最新资源

Datawhale 组队学习打卡营任务13：卷积神经网络基础

h5 对人组队游戏源码