PyTorch深度学习：全面解析神经网络层

版权申诉

47 浏览量更新于2024-07-01 收藏 965KB DOC 举报

"这篇文档是关于PyTorch中常用神经网络层的汇总，特别是对卷积层（Convolution Layers）的介绍，特别是nn.Conv2d层的详细解析，包括其参数、属性和用法示例。文档内容持续更新，旨在为PyTorch使用者提供全面的参考信息。" 在深度学习框架PyTorch中，nn.Conv2d是实现2D卷积的核心层，用于处理多通道的输入图像数据。这个层在计算机视觉任务，如图像分类、目标检测和图像生成等领域中有着广泛的应用。 1. 参数详解： - `in_channels`：定义输入图像的通道数，例如，RGB图像有3个通道。 - `out_channels`：定义输出特征图的通道数，也称为滤波器数量，每个滤波器都会在输入上产生一个新的通道。 - `kernel_size`：卷积核的尺寸，可以是单个整数（正方形卷积核）或一对整数（矩形卷积核）。 - `stride`：卷积核在输入图像上移动的步长，决定输出图像的缩小程度。 - `padding`：用于在输入图像边缘添加零值区域，保持输出尺寸不变或增加视野。 - `dilation`：控制卷积核元素之间的空隙，影响感受野大小，用于实现空洞卷积。 - `groups`：分组卷积的数目，将输入通道分成多个组，每组对应一组滤波器，减少计算量并引入稀疏连接。 - `bias`：布尔值，决定是否添加可学习的偏置项。 - `padding_mode`：定义填充的方式，包括'zeros'(默认)、'reflect'、'replicate'和'circular'。 2. 属性介绍： - `Linear.weight`：权重张量，形状为`(out_channels, in_channels/group, kernel_size[0], kernel_size[1])`，表示滤波器的权重。 - `Linear.bias`：如果`bias=True`，则存在此属性，形状为`(out_channels)`，表示每个输出通道的可学习偏置。 3. 使用示例： ```python import torch import torch.nn as nn m = nn.Conv2d(16, 33, (3, 5), stride=(2, 1)) ``` 这段代码创建了一个`nn.Conv2d`实例，输入通道数为16，输出通道数为33，卷积核大小为3x5，步长为2x1。 4. 其他常见卷积层： - `nn.Conv1d`：用于1D序列数据的卷积。 - `nn.Conv3d`：处理3D数据，如视频帧的卷积。 - `nn.MaxPool2d`和`nn.AvgPool2d`：分别执行最大池化和平均池化，减小特征图尺寸。 - `nn.BatchNorm2d`：批量归一化，加速训练并提高模型稳定性。 - `nn.ReLU`：激活函数，用于引入非线性。通过这些层的组合，可以构建复杂的卷积神经网络（CNNs），如VGG、ResNet、Inception等。理解并熟练使用这些层对于进行深度学习实践至关重要。文档的持续更新意味着会不断加入更多相关知识，帮助开发者更好地理解和应用PyTorch中的卷积网络。

注：当 ceil_mode=True 时，如果滑动窗口从左侧填充或输入中开始，则允许它们越界。

在右侧填充区域开始的滑动窗口将被忽略。

（2）参数

kernel_size— 表示做最大池化的窗口大小，可以是单个值，也可以是 tuple 元组

stride— 卷积步长，即卷积核在图像上每次平移的间隔。默认：kernel_size

padding— 图像上下左右四边填充为 0 的行数和列数。默认：0

ceil_mode— 使用向上取整（ceil）或向下取整（floor）的方式计算得到输出形状。默认：

False（floor，向下取整）

count_include_pad— 是否在平均计算中包含零填充。默认：True

divisor_override— 如果指定，它将用作除数，否则将使用池化区域的大小

（3）用法示例

# pool of square window of size=3, stride=2

m = nn.AvgPool2d(3, stride=2)

# pool of non-square window

m = nn.AvgPool2d((3, 2), stride=(2, 1))

input = torch.randn(20, 16, 50, 32)

output = m(input)

print(f’\ninput shape: {input.shape}’, f’output shape: {output.shape}’, sep=‘\n’)

2.3 AdaptiveMaxPool2d

剩余29页未读，继续阅读

书博教育

粉丝: 1
资源: 2837

PyTorch深度学习：全面解析神经网络层

PyTorch构建神经网络教程

PyTorch卷积神经网络的实现指南

PyTorch深度神经网络及训练入门与实践教程

在PyTorch学习神经网络像CNN, BiLSTM.zip

用Pytorch卷积神经网络实现蒸汽波逆滤波器.zip

PyTorch深度学习实战常用神经网络层.docx

PyTorch搭建神经网络.ipynb

基于Pytorch的卷积神经网络MNIST手写数字识别适用于Pytorch和神经网络的初学者学习.zip

使用PyTorch构建神经网络.pdf

基于PyTorch的神经网络构建与训练指南.html

最新资源