unet上采样采用padding怎么计算
时间: 2023-03-20 16:01:50 浏览: 159
unet练手数据集(Carvana数据集)
在U-Net中,上采样操作通常使用反卷积(Deconvolution)或转置卷积(Transpose Convolution)来实现。在这个过程中,我们需要在输入的特征图中插入一些空白区域(padding),以便使输出特征图的尺寸等于输入特征图的尺寸的两倍。
假设我们有一个大小为 $H_{in}\times W_{in}$ 的输入特征图,上采样的倍数为 $k$,那么我们需要在输入特征图的边缘插入 $k-1$ 行(列)的空白像素,以便将输入特征图的大小扩大 $k$ 倍。具体而言,我们需要在上下左右四个方向插入:
- 上方:$\lfloor\frac{(k-1)}{2}\rfloor$ 行空白像素
- 下方:$\lceil\frac{(k-1)}{2}\rceil$ 行空白像素
- 左侧:$\lfloor\frac{(k-1)}{2}\rfloor$ 列空白像素
- 右侧:$\lceil\frac{(k-1)}{2}\rceil$ 列空白像素
因此,输出特征图的大小为 $(H_{in}\times k)\times (W_{in}\times k)$,而输入特征图的大小为 $H_{in}\times W_{in}$。需要注意的是,在计算输出特征图的大小时,我们需要使用向上取整和向下取整两种方式,以确保插入空白像素后输出特征图的大小和输入特征图的大小成比例。
阅读全文