深度CNN中的shortcut结构：从Highway到ResNet、DenseNet

需积分: 0 122 浏览量更新于2024-08-05 1 收藏 748KB PDF 举报

"本文介绍了深度卷积神经网络CNN中shortcut的使用，从Highway Networks到ResNet再到DenseNet，展示了shortcut在解决深度网络梯度消失和训练难题中的重要作用。" 深度卷积神经网络（CNN）在计算机视觉领域的广泛应用始于2012年AlexNet在ImageNet竞赛中的成功。然而，随着网络深度的增加，模型训练的难度也随之上升，这主要是因为梯度消失问题。为了解决这一问题，研究人员引入了shortcut或shortpath，即层之间的直接连接，以优化网络的训练过程。首先，Highway Networks是最早尝试引入shortcut概念的模型之一。在传统的CNN（plain networks）中，仅相邻的两层之间有连接。Highway Networks通过在层间添加一个带权重的shortcut，形成类似图2的结构，允许输入信号x通过一个称为"carry gate"（C）的权重直接传递到输出层y，同时还有一个"transform gate"（T）进行特征变换。这样，即使在网络深处，输入信号也能有效地传播，降低了梯度消失的影响。实验结果表明，Highway Networks在训练误差和深度网络性能上都优于plain networks。接着，Residual Networks（ResNet）进一步发展了shortcut的概念。ResNet的核心思想是通过identity mapping（恒等映射），即shortcut直接将输入传递到输出，并加上网络的残差学习，使得网络可以更有效地学习深度层级的特征。ResNet的设计使得即使在网络非常深时，信息依然能够无障碍地流动，解决了训练深层网络的难题，极大地推动了深度学习的发展。最后，DenseNet是另一个利用shortcut的创新模型。不同于ResNet的并行结构，DenseNet采用了密集连接（dense connectivity），每个层都会连接到所有后续层，形成一个“稠密块”。这种设计不仅保留了ResNet的梯度流，还增强了特征的重用，减少了参数数量，提高了计算效率。 shortcut的引入是深度学习领域的一个重大突破，它有效地解决了深度CNN中的梯度消失问题，促进了更深、更复杂的网络架构的训练和发展。从Highway Networks到ResNet再到DenseNet，这些模型的演变展示了shortcut在优化网络训练、提升模型性能方面的巨大潜力，为深度学习带来了革命性的进步。

图3

算法在CIFAR数据集上的分类结果如图4所示。

图4

   尽管在实验结果上，highway networks并没有比之前的一些模型取

得显著地提升，但是它的这种思想对后面的模型改进影响非常大。

二、ResNet

   ResNet [3]的动机依然是解决深度模型中的退化问题：层数越深，

梯度越容易发散，误差越大，难以训练。理论上，模型层数越深，误差应该越小

才对，因为我们总可以根据浅层模型的解构造出深层模型的解（将深层模型与浅

层模型对应的层赋值为浅层模型的权重，将后面的层取为恒等映射），使得这个

深层模型的误差不大于浅层模型的误差。但是实际上，深度模型的误差要比浅层

模型的误差要大，在CIFAR-10上面的训练和测试误差如图5所示。

剩余12页未读，继续阅读

陈后主

粉丝: 39
资源: 340

深度CNN中的shortcut结构：从Highway到ResNet、DenseNet

Windows快捷键大全完整指南

ResNet遥感图像分类：卷积神经网络的深度实现

VS代码段快捷键自定义步骤详解

gpp:shortcut of git add + git commit -m + git push 一键 git 提交

基于深度卷积神经网络的农作物病害识别.pdf

rofi-i3-shortcut-help：https：gitlab.com的镜像matclabrofi-i3-shortcut-help

WhatFontis.com右键单击快捷方式「WhatFontis.com right-click shortcut」-crx插件

mawby.dev.shortcut-launcher-开源

Wunderlist.com快捷方式「Wunderlist.com Shortcut」-crx插件

Shortcut Java-开源

最新资源