深度学习模型压缩与加速技术探析

140 浏览量更新于2024-08-28 收藏 363KB PDF 举报

"深度学习模型压缩与加速综述" 在深度学习领域，模型压缩与加速是当前研究的热点问题，尤其对于资源有限的移动端设备来说，高效利用计算资源和存储空间至关重要。模型压缩主要目的是减小模型大小，降低计算复杂度，而加速网络设计则旨在在保持性能的同时，提高模型运行速度。一、分组卷积分组卷积是一种有效的模型压缩技术，它将输入特征映射（featuremaps）分为多个组，并对每个组独立执行卷积操作。这减少了参数数量和计算量，但可能导致不同组间的特征信息交流减少。为解决这一问题，出现了两种经典结构：ShuffleNet和MobileNet。 1) ShuffleNet结构： ShuffleNet通过引入通道混洗操作解决了分组卷积的信息流通问题。在普通的分组卷积中，输出通道只与输入的特定通道相关，ShuffleNet则通过通道混洗确保了全局信息的流通，增强了网络的表达能力。 2) MobileNet结构： MobileNet的核心是深度可分离卷积（depthwise separable convolutions），它将标准卷积分解为深度卷积（depthwise convolution）和1x1点卷积（pointwise convolution）。深度卷积针对每个通道单独进行，显著降低了计算量，随后的1x1卷积用于通道间的信息融合，进一步减少了计算成本。二、分解卷积分解卷积是另一种压缩策略，它将标准卷积分解为更小的卷积，例如将一个大核的卷积分解为几个小核的卷积。这种方法可以有效地减少参数数量，同时保持模型的表达能力。例如，可以将一个大尺寸的卷积核分解为多个小尺寸的卷积核组合，通过这种方式减少计算量，而不牺牲太多性能。三、其他压缩与加速技术除了分组卷积和分解卷积，还有其他技术也常用于模型压缩与加速，例如： 1) 权重量化：将模型的浮点权重转换为低精度整数，以减少存储需求并加快计算速度。 2) 模型剪枝：删除模型中对性能影响较小的权重或连接，精简网络结构。 3) 知识蒸馏：大型模型（教师模型）的输出被用来训练小型模型（学生模型），使学生模型能学习到教师模型的高级表示，同时保持较小的规模。 4) 弹性平均：在训练过程中使用一个移动平均版本的权重，可以提高模型的稳定性和推理速度。深度学习模型压缩与加速的目标是在保证模型性能的前提下，优化模型的效率，使其能够在各种硬件平台上顺畅运行，尤其是在资源受限的移动设备上。随着研究的深入，更多创新的压缩与加速技术将持续涌现，推动深度学习的应用边界不断扩展。

深度学习模型压缩与加速综述深度学习模型压缩与加速综述

摘要

目前在深度学习领域分类两个派别，一派为学院派，研究强大、复杂的模型网络和实验方法，为了追求更高的性能；另一派为

工程派，旨在将算法更稳定、高效的落地在硬件平台上，效率是其追求的目标。复杂的模型固然具有更好的性能，但是高额的

存储空间、计算资源消耗是使其难以有效的应用在各硬件平台上的重要原因。所以，卷积神经网络日益增长的深度和尺寸为深

度学习在移动端的部署带来了巨大的挑战，深度学习模型压缩与加速成为了学术界和工业界都重点关注的研究领域之一。

I. 加速网络设计

分组卷积

分组卷积即将输入的feature maps分成不同的组（沿channel维度进行分组），然后对不同的组分别进行卷积操作，即每一个

卷积核至于输入的feature maps的其中一组进行连接，而普通的卷积操作是与所有的feature maps进行连接计算。分组数k越

多，卷积操作的总参数量和总计算量就越少（减少k倍）。然而分组卷积有一个致命的缺点就是不同分组的通道间减少了信息

流通，即输出的feature maps只考虑了输入特征的部分信息，因此在实际应用的时候会在分组卷积之后进行信息融合操作，接

下来主要讲两个比较经典的结构，ShuffleNet[1]和MobileNet[2]结构。

1) ShuffleNet结构：

如上图所示，图a是一般的group convolution的实现效果，其造成的问题是，输出通道只和输入的某些通道有关，导致全局信

息流通不畅，网络表达能力不足。图b就是shufflenet结构，即通过均匀排列，把group convolution后的feature map按通道进

行均匀混合，这样就可以更好的获取全局信息了。图c是操作后的等价效果图。在分组卷积的时候，每一个卷积核操作的通道

数减少，所以可以大量减少计算量。

2) MobileNet结构：

下载后可阅读完整内容，剩余6页未读，立即下载

weixin_38515897

粉丝: 2
资源: 961

深度学习模型压缩与加速技术探析

深度学习模型压缩与加速：分组卷积与经典结构解析

深度学习模型压缩技术综述：算法总结与应用前景

深度学习模型压缩与加速：现状与硬件实现

深度学习模型压缩与加速综述_模型压缩_深度学习_压缩深度学习_

深度学习模型压缩与加速综述.pdf

2022深度学习模型压缩与加速策略综述

《文本深度学习模型压缩》综述论文

深度神经网络模型压缩综述

"深度学习模型压缩、加速及移动端部署研究综述

深度神经网络模型压缩与加速技术综述

最新资源