ResNet网络Pytorch实战.pdf_resnet网络实例 - CSDN文库

pytorch代码实现

卷积神经网络

需积分: 50 150 浏览量更新于2023-03-16 评论 1 收藏 1.22MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源评论

资源推荐

ResNet

[1]

引言：

ResNet 网络是在 2015 年由微软实验室（何凯明）提出，斩获当年 ImageNet 竞赛中分类

任务第一名，目标检测第一名。获得 COCO 数据集中目标检测第一名，图像分割第一名。

该网络的亮点：

1.超深的网络结构，最高超过 1000 层；

2.提出 Residual 结构（残差结构）；

3.使用 Batch Normalization 加速训练（丢弃 dropout）。

下面先来看看 ResNet-34 网络结构图：

图 1 ResNet-18 网络结构图

ResNet-34 网络结构简单：

输入-卷积层-池化层-若干残差结构（卷积层加残差）-池化层-全连接层-输出

（1）为什么说 ResNet 是真正的深度网络？

在 ResNet 网络提出之前，传统的卷积神经网络都是通过将一系列卷积层与池化层进行

堆叠得到的。一般我们会觉得网络越深，特征信息越丰富，模型效果应该越好。但是实验证

明，单纯的堆叠层数不仅训练参数变多了（时间成本增加），而且训练性能可能会更低。这

是因为当网络堆叠到一定深度时，会出现三个问题：梯度消失、梯度爆炸以及退化问题。

ResNet 的提出解决了以上个问题（4 个），让 CNN 真正步入深度模型。

参数过多：随着层数增加，自然需要训练的参数就会更多，导致训练时间成本增加；

梯度消失：若每一层的误差梯度小于 1，反向传播时，网络越深，每一层的梯度累积梯

度就会越趋近于 0；

梯度爆炸：若每一层的误差梯度大于 1，反向传播时，网路越深，每一层的梯度累积相

乘就会越来越大；

退化问题(degradation problem)：在解决了梯度消失、爆炸问题后，可能仍然存在深层

网络的效果可能比浅层网络差的现象；

总结就是，当网络堆叠到一定深度时，反而会出现深层网络比浅层网络效果差的情况。

如下图所示，20 层网络反而比 56 层网络的误差更小：

剩余13页未读，继续阅读

评论0

嘎嘎声现在

粉丝: 7
资源: 6

会员权益专享

图片转文字

全年可省5，000元立即开通

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈