Resnet的网络结构 - CSDN文库

ResNet（Residual Network）是一个非常经典的深度学习模型，它的主要特点是使用了残差块（Residual Block）来解决深度神经网络中的梯度消失和梯度爆炸问题，从而可以训练更深的神经网络。 ResNet的网络结构相对于传统的卷积神经网络，增加了很多的层数，一般有18层、34层、50层、101层和152层等不同版本。其中比较经典的是ResNet50，下面以ResNet50为例介绍其网络结构。 ResNet50主要由以下几个模块组成： 1. 输入层：输入一张图片，一般大小为224x224x3。 2. Conv1：一个卷积层，使用64个大小为7x7的卷积核，步长为2，padding为3，输出大小为112x112x64。 3. MaxPool：一个最大池化层，使用3x3的池化核，步长为2，输出大小为56x56x64。 4. ResBlock1：第一个残差块，包括3个卷积层，每个卷积层后面都紧跟一个BatchNorm层和ReLU激活函数层，其中第一个卷积层使用64个大小为1x1的卷积核，第二个卷积层使用64个大小为3x3的卷积核，第三个卷积层使用256个大小为1x1的卷积核，最后将输入和输出相加，输出大小为56x56x256。 5. ResBlock2：第二个残差块，包括4个残差块，每个残差块的结构和ResBlock1相同，只是输入和输出的通道数不同，输出大小为28x28x512。 6. ResBlock3：第三个残差块，包括6个残差块，每个残差块的结构和ResBlock1相同，只是输入和输出的通道数不同，输出大小为14x14x1024。 7. ResBlock4：第四个残差块，包括3个残差块，每个残差块的结构和ResBlock1相同，只是输入和输出的通道数不同，输出大小为7x7x2048。 8. AvgPool：一个平均池化层，使用7x7的池化核，输出大小为1x1x2048。 9. Flatten：将输出的1x1x2048的张量展开成2048维的向量。 10. FC：一个全连接层，将2048维的向量映射到1000维的向量，代表1000个类别的概率。 11. Softmax：一个Softmax层，将1000维的向量转化为对应1000个类别的概率分布。以上就是ResNet50的网络结构，其中的ResBlock是ResNet的核心，通过残差连接解决了深度神经网络中的梯度消失和梯度爆炸问题。

阅读全文

相关推荐

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通