深度学习模型压缩与加速：分组卷积与经典结构解析

79 浏览量更新于2024-08-27 收藏 363KB PDF 举报

深度学习模型压缩与加速综述深度学习领域主要分为学院派和工程派。学院派专注于研发高性能、复杂的模型，以提升模型的精度，但这些模型往往因庞大的存储需求和计算负担而在实际应用中面临挑战，特别是对于移动设备等资源有限的平台。为了克服这一问题，工程派致力于寻找方法使得算法能在硬件上高效运行，这就催生了深度学习模型压缩与加速的研究。压缩和加速技术主要包括以下几个方面： 1. 分组卷积：这是降低计算复杂度的有效手段。它将输入特征图（featuremaps）按通道分组，每个卷积核只作用于一组特征，从而减少参数和计算量。分组越多，计算成本降低，但可能会牺牲一部分信息交换，因此通常会结合后继的信息融合操作。ShuffleNet利用均匀排列的方式增强全局信息流通，提高了网络表达能力。MobileNet则采用深度可分离卷积（Depthwise Separable Convolution），它将卷积分为深度卷积（处理每个通道）和点卷积（合并通道），大大减小了计算负担。 2. 分解卷积：这是MobileNet的核心思想，将标准卷积分解为深度卷积和点卷积两部分。深度卷积仅在通道维度上进行，减少了参数数量，而点卷积负责通道间的交互，两者结合后显著降低了模型大小和计算复杂度。 3. 量化与权重剪枝：通过量化技术，将模型参数由浮点数转换为低精度整数，减少存储空间。权重剪枝则是移除或降低权重的重要性，保留关键部分，进一步节省存储和计算资源。 4. 模型蒸馏：这是一种知识转移的技术，将大模型的知识转移到小模型中，使得小模型在保持一定性能的同时，拥有更快的推理速度和更低的存储需求。 5. 硬件优化：针对特定硬件平台，如GPU、TPU或移动设备，进行定制化模型设计，包括硬件加速器、深度学习指令集优化等，以提高执行效率。 6. 动态计算图与自适应架构：允许模型在运行时根据输入数据的特性动态调整结构，以适应不同场景下的计算需求，达到节能和性能优化的目的。深度学习模型压缩与加速是当前研究热点，它旨在平衡模型性能和资源占用，推动深度学习技术在各种设备上的广泛应用，尤其在移动端，这种平衡显得尤为重要。通过上述策略的综合运用，研究人员和工程师们正在不断探索更高效、更实用的深度学习解决方案。

深度学习模型压缩与加速综述深度学习模型压缩与加速综述

摘要

目前在深度学习领域分类两个派别，一派为学院派，研究强大、复杂的模型网络和实验方法，为了追求更高的性能；另一派为

工程派，旨在将算法更稳定、高效的落地在硬件平台上，效率是其追求的目标。复杂的模型固然具有更好的性能，但是高额的

存储空间、计算资源消耗是使其难以有效的应用在各硬件平台上的重要原因。所以，卷积神经网络日益增长的深度和尺寸为深

度学习在移动端的部署带来了巨大的挑战，深度学习模型压缩与加速成为了学术界和工业界都重点关注的研究领域之一。

I. 加速网络设计

分组卷积

分组卷积即将输入的feature maps分成不同的组（沿channel维度进行分组），然后对不同的组分别进行卷积操作，即每一个

卷积核至于输入的feature maps的其中一组进行连接，而普通的卷积操作是与所有的feature maps进行连接计算。分组数k越

多，卷积操作的总参数量和总计算量就越少（减少k倍）。然而分组卷积有一个致命的缺点就是不同分组的通道间减少了信息

流通，即输出的feature maps只考虑了输入特征的部分信息，因此在实际应用的时候会在分组卷积之后进行信息融合操作，接

下来主要讲两个比较经典的结构，ShuffleNet[1]和MobileNet[2]结构。

1) ShuffleNet结构：

如上图所示，图a是一般的group convolution的实现效果，其造成的问题是，输出通道只和输入的某些通道有关，导致全局信

息流通不畅，网络表达能力不足。图b就是shufflenet结构，即通过均匀排列，把group convolution后的feature map按通道进

行均匀混合，这样就可以更好的获取全局信息了。图c是操作后的等价效果图。在分组卷积的时候，每一个卷积核操作的通道

数减少，所以可以大量减少计算量。

2) MobileNet结构：

下载后可阅读完整内容，剩余6页未读，立即下载

weixin_38682254

粉丝: 7
资源: 938

深度学习模型压缩与加速：分组卷积与经典结构解析

最新资源