SkipNet: 动态学习跳过卷积网络，提升效率与精度

66 浏览量更新于2024-06-20 收藏 868KB PDF 举报

SkipNet是一种创新的深度学习架构，由王欣、余飞等学者提出，他们来自加州大学伯克利分校和南京大学。核心思想是针对视觉感知任务中的深度需求，提出了一种动态跳过卷积层的方法。传统的观点认为深度网络能够提升准确性，但实际研究表明并非所有输入都需要深度网络的全面处理。SkipNet通过引入门控单元和修改后的残差网络结构，学习每个输入的特定策略，智能地决定在推理阶段哪些卷积层可以跳过。该工作将动态跳过问题视为一个顺序决策问题，其中模型依赖于前几层的输出来判断是否继续执行后续层。这种方法旨在在保持预测精度的前提下，显著减少计算量，因为不是所有的层都对所有输入有同等的重要性。通过这种方式，SkipNet能够降低模型的平均计算成本，同时深入理解各个卷积层对于不同输入的贡献。学习有效的跳过策略是一个难题，因为这涉及到非连续的决策过程，无法直接应用梯度下降等基于连续优化的方法。为此，SkipNet采用了一种混合学习策略，结合了监督学习和强化学习。强化学习被用来解决不可微跳跃决策的问题，通过训练神经网络来学习最优的跳过策略。实验结果显示，SkipNet在四个基准数据集上的性能优于先进的动态网络和静态压缩技术，尽管计算量减少了30%到90%，但保持了原始模型的准确性。此外，研究者还进行了定性评估，探究了门控政策如何随着图像复杂度（如尺度和显著性）变化以及与跳过层数的关系。 SkipNet不仅提供了深度学习网络的高效使用方式，还为理解和优化深度网络的结构提供了新的视角，有助于在实际应用中平衡性能和计算资源的需求。

Wang等人

（x

(a)

前馈门

（b）递归门

图2：我们研究了两种门控设计的SkipNets（a）每个残差块具有唯一的门控模

块和门控参数。（b）各大楼共用一个统一的循环门

其中

（

）∈ {0

，

1}是层

的门控函数。为了使

。

是良好定义的，我们要

求

（

）和xi

具有

相同的维数。通常使用的剩余网络架构满足此要求，其中

一期

ResNet

I I

ResNet

我

ResNet

、

（二）

并且可以通过汇集

以

匹配

（

）的维度来寻址。

浇口网络设计既要有足够的表现力，又要准确

确定要跳过哪些层，同时还在计算上便宜。为了解决准确性和计算成本之间的

这种权衡，我们探索了一系列门控网络设计（Sec.3.1）将前馈卷积架构跨越到

具有不同程度的参数共享的递归网络在任一种情况下，估计门控网络参数由于

离散的门控决策以及最大化精度和最小化成本的竞争目标而变得复杂。为了学

习门控网络，我们引入了一种两阶段训练算法，该算法结合了监督预训练（第

二节）。3.3）基于策略优化（第3.2）使用将预测准确度与计算成本组合的混合

奖励函数

3.1

门控网络设计

在本文中，我们评估了两个前馈卷积门设计（图1）。2a）。FFGate-I（图3a）

设计由两个3×3卷积层组成，步长分别为1和2，然后是全局平均池化层和全连

接层，以输出一维向量。为了减少门计算，我们添加一个在第一个卷积层之

前的2×2最大池化层总体计算

FFGate-I的成本大约是本文中使用的残差块[10]的19%作为一个com-

作为一种公认的更便宜的替代方案，我们还引入了FFGate-II（图1）。3b），

由一个3×3步幅2卷积层组成，随后是与FFGate-I相同的全局平均池化和全连接

层。FFGate-II的计算成本为12

。

剩余块成本的5%。在我们的实验中，我们将

FFGate-II用于具有以下参数的网络：

超过100层，FFGate-I适用于较浅的网络。

前馈门设计计算起来仍然相对昂贵，并且不利用来自先前门的决定。因此，

我们引入了

递归门

（RNNGate）设计（图1）。3c），其实现参数共享并且允许

门跨级重用计算我们首先对输入要素应用全局平均池化

）

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

SkipNet: 动态学习跳过卷积网络，提升效率与精度

AdaBoost-CNN：一种用于卷积神经网络的自适应增强算法，用于使用迁移学习对多类不平衡数据集进行分类，Python完整源码

深度学习在图像分类中的应用：构建您的第一个卷积神经网络（CNN）.md

matlab深度学习入门实例:从0搭建卷积神经网络cnn

目前最先进的卷积神经网络

我该怎么学习卷积神经网络

深度可分离卷积神经网络相比卷积神经网络的优点

卷积神经网络需要优化的原因

卷积网络训练后如何使用

静态卷积的限制和动态卷积

如何学习卷积神经网络

最新资源