size为(256,64,18,128)的tensor,输入卷积层nn.Conv2d(64,128,(6,3),stride=(3,3),padding=(1,3)),输出的size是什么?
时间: 2023-10-20 11:08:15 浏览: 60
输入的size为(256, 64, 18, 128),其中256表示batch size, 64表示输入的channel数,18表示输入的高度,128表示输入的宽度。
卷积核的尺寸为(6,3),stride为(3,3),padding为(1,3),则输出的size为(256, 128, 6, 44)。其中256表示batch size,128表示卷积核的个数,6表示输出的高度,44表示输出的宽度。
具体计算公式为:
- 输出的高度:$H_{out} = \lfloor \frac{H_{in} + 2 \times \text{padding}[0] - \text{dilation}[0] \times (\text{kernel\_size}[0] - 1) - 1}{\text{stride}[0]} + 1 \rfloor = \lfloor \frac{18 + 2 \times 1 - 1 \times (6 - 1) - 1}{3} + 1 \rfloor = 6$
- 输出的宽度:$W_{out} = \lfloor \frac{W_{in} + 2 \times \text{padding}[1] - \text{dilation}[1] \times (\text{kernel\_size}[1] - 1) - 1}{\text{stride}[1]} + 1 \rfloor = \lfloor \frac{128 + 2 \times 3 - 1 \times (3 - 1) - 1}{3} + 1 \rfloor = 44$
因此,输出的size为(256, 128, 6, 44)。
阅读全文