PyTorch逆卷积ConvTranspose2d详解与应用

版权申诉

137 浏览量更新于2024-09-10 1 收藏 222KB PDF 举报

"逆卷积(ConvTranspose2d)在PyTorch中的应用及理解" 逆卷积，也称为上采样卷积或转置卷积，是深度学习中用于图像生成、 upsampling 和反卷积网络的核心操作。在PyTorch中，这个操作通过`torch.nn.ConvTranspose2d`模块来实现。它主要用于将低分辨率的特征图恢复到较高分辨率，同时允许添加新的特征信息。 `torch.nn.ConvTranspose2d`的主要参数包括： 1. `in_channels`: 输入特征图的通道数。 2. `out_channels`: 输出特征图的通道数。 3. `kernel_size`: 卷积核的尺寸，可以是单个数值或一个包含两个元素的元组，分别对应宽度和高度。 4. `stride`: 卷积步长，决定每次移动的距离，同样可以是单个数值或一个包含两个元素的元组。 5. `padding`: 在输入特征图边缘添加的零的数目，以确保输出尺寸不变。 6. `output_padding`: 对输出特征图的额外填充，用于微调输出尺寸。 7. `groups`: 控制输入和权重之间的连接方式，例如1表示所有输入通道都连接到所有输出通道，大于1则表示分组卷积。 8. `bias`: 是否使用偏置项，默认为True。 9. `dilation`: 控制滤波器中元素间的空隙，增加感受野。 10. `padding_mode`: 填充模式，默认为'zeros'，也可以是'reflect'或'symmetric'。卷积的转置过程可以分为内部变换和外部变换两个步骤： **内部变换**：如果在原始卷积中设置了`stride > 1`，那么在逆卷积时，需要对输入特征图进行插值操作。这意味着在特征图的每一行和列的相邻元素之间插入`(stride - 1)`个零值。这使得逆卷积后得到的特征图尺寸可以匹配原始卷积前的尺寸。 **外部变换**：外部变换与原始卷积的`padding`有关。在原始卷积中，`padding`是为了保持输出尺寸不变而添加的零。在逆卷积中，我们需要去除这些额外的零，以恢复原始输入的尺寸。如果在原始卷积中有`padding`，那么在逆卷积中可能需要使用`output_padding`来调整输出尺寸，使其精确地等于输入尺寸。逆卷积在实际应用中，比如在U-Net这样的网络架构中，用于将下采样的特征信息恢复到原始输入的尺寸，同时结合低级特征以生成高质量的输出图像。此外，它也在图像超分辨率、语义分割和图像风格转换等任务中发挥重要作用。总结来说，`nn.ConvTranspose2d`是PyTorch中用于执行逆卷积操作的关键模块，它允许我们恢复特征图的尺寸，同时引入新的特征信息，这对于理解和构建深度学习模型中的upsampling和图像生成部分至关重要。正确理解和运用这些参数能帮助优化网络性能，适应不同的计算机视觉任务需求。

nn.ConvTranspose2d 逆卷积逆卷积反卷积反卷积

本文转摘于如下链接：

逆卷积的详细解释ConvTranspose2d（fractionally-strided convolutions) https://www.cnblogs.com/wanghui-

garcia/p/10791328.html

pytorch官方手册：https://pytorch.org/docs/stable/nn.html?highlight=convtranspose#torch.nn.ConvTranspose2d

ConvTranspose2d

torch.nn.ConvTranspose2d(in_channels, out_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, bias=True, dilation=1,

padding_mode='zeros')

output_padding参数作用：https://www.cnblogs.com/wanghui-garcia/p/10791778.html

1.首先先定义进行卷积的参数：

输入特征图为高宽一样的Hin*Hin大小的x

卷积核大小kernel_size

步长stride

padding填充数(填充0)

输出特征图为Hout*Hout大小的y

计算式子为：

Hout = floor( Hin + 2*padding – kernel_size / stride) + 1

2.然后实现上面的卷积的转置卷积

定义其参数为：

输入特征图为高宽一样的Hout*Hout大小的y

卷积核大小kernel_size

步长stride

paddingnew 填充数(填充0)

输出特征图为Hin*Hin大小的x

逆卷积的过程主要分两步：

对输入的特征图y进行变换，得到新的特征图ynew

内部变换，与卷积时设置的stride相关

外部变换，与卷积时设置的padding相关

根据得到的特征图进行卷积即可

1）对输入的特征图y进行变换，得到新的特征图ynew

1》内部变换

当卷积时设置的stride>1时，将对输入的特征图y进行插值操作(interpolation)。

即需要在输入的特征图y的每个相邻值之间插入(stride-1)行和列0，因为特征图中能够插入的相邻位置有(height-1)个位置，所

以此时得到的特征图的大小由HoutHout(Hout

即

height)

变为新的

Hout_newHout_new，即[Hout + (stride-1) * (Hout-1)] *

[Hout + (stride-1) * (Hout-1)]

2》外部变换

为了实现由HoutHout

大小的

逆卷积得到

HinHin大小的x，还需要设置paddingnew的值为(kernel_size – padding – 1),这里的

padding是卷积操作时设置的padding值

所以计算式子变为：

Hin = floor( [Hout_new + 2*paddingnew – kernel_size] / stride’) + 1

⚠️该式子变换后，定义向下取整的分母stride’值为定值1

Hout_new和paddingnew的值代入上面的式子，即变为：

Hin = floor( Hout + (stride-1) * (Hout-1) + 2*(kernel_size – padding – 1) – kernel_size) + 1

化简为：

Hin = floor( (Hout – 1) * stride – 2*padding + kernel_size – 1) + 1

= (Hout - 1) * stride - 2*padding + kernel_size

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38732811

粉丝: 6
资源: 958

PyTorch逆卷积ConvTranspose2d详解与应用

HTML主体标签与颜色设定：理解tensorflow的tf.nn.conv2d_transpose反卷积实现

TensorFlow中tf.nn.conv2d_transpose的反卷积实现解析

Tensorflow反卷积操作解析：TF.nn.conv2d_transpose在HTML表格中的应用

nn.ConvTranspose2d()实现二倍反卷积

最新资源