优化存储与计算：卷积神经网络压缩与加速策略探讨

机器学习

卷积神经网络

需积分: 9 78 浏览量更新于2024-09-08 1 收藏 1.14MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

卷积神经网络的压缩和加速是现代深度学习领域中的重要研究课题，主要源于现实中的存储和计算资源限制。随着技术的发展，复杂的网络模型需要大量的存储空间和计算时间，而许多网络中的参数往往存在冗余，这些冗余参数对模型的实际性能并无显著提升，却占据了宝贵的资源。因此，对网络进行压缩和加速的必要性在于追求更高的效率，减少无意义参数的影响。最早的网络压缩尝试可以追溯到1989年的LeCun提出的网络裁枝方法，他通过分析损失函数对参数的重要性，删除不重要的部分来减少模型大小。然而，这一时期由于硬件条件的限制，进展相对缓慢。2012年，AlexNet的成功使得卷积神经网络（CNN）得到了广泛关注，并带动了压缩技术的快速发展。 CNN本身即体现了权值共享的概念，大大减少了模型的参数数量。此后，压缩方法变得更加多样化，主要分为四个方向： 1. **网络裁枝**：继续沿用LeCun的方法，通过评估参数的重要性来决定哪些部分可以被剔除。这种技术试图保留对模型关键性能贡献的连接，同时去除冗余。 2. **模型量化**：通过将浮点数参数转换为低精度的整数或二进制，降低存储需求，同时可能对计算性能有所提升，但可能会牺牲一些精度。 3. **低秩估计**：假设模型参数可以近似为低秩矩阵，通过分解和重构减少参数数量，这种方法通常在保持模型性能的同时提供高效的存储和计算。 4. **模型蒸馏**：这是一种知识转移的技术，利用一个较大的、预训练的模型（教师模型）指导较小、较轻量级的模型（学生模型）学习，从而在保持一定性能的前提下减小模型规模。尽管深度学习平台普遍采用矩阵乘法实现卷积，但在进行裁枝时，必须谨慎处理剪枝对网络结构和输出的影响，确保不会过度削弱模型的能力。网络剪枝的成功依赖于精确的参数重要性评估策略和有效的逆向传播算法。总结来说，卷积神经网络的压缩和加速不仅是应对现有硬件限制的策略，更是追求高效、轻量化模型的重要手段。未来的研究将继续探索更精细的参数剪枝方法、优化量化方案以及创新的模型简化技术，以适应不断发展的计算环境。

资源详情

资源推荐

同的输入矩阵)，对输入特征图与输出矩阵没有任何影响。

对第二个想法，我们可以进一步改进：如果将 3*3 的 kernel 删成某个固定的形状，例如

下图中，那么我们可以修改 im2col 操作，保证卷积的正确性，这就是 Group-level 的裁枝(图

4 中所示)

图 3 另类 kernel(白色为 0 值)

第三个想法：如果我们不急着删去参数，而是将那些没用的参数设为 0，当整个参数矩

阵中有很多的 0 时，稀疏矩阵闪亮登场，于是矩阵的乘法可以用稀疏矩阵的乘法来代替，从

而起到模型压缩和加速的效果。图 4 中，Fine-grained，vector-level，kernel-level 中一些裁剪

方法，需要使用到稀疏卷积的方法来实现。

图 4 裁枝类型图示

[2]

上述是从矩阵方面，对裁枝方法进行了讲解，其实我们忽略了一个重要的问题：究竟什

么样的参数需要裁掉呢？一般有两种方法：损失函数对参数的二阶导，和参数的绝对值大小。

第一种方法，损失函数对参数的二阶导越小，说明这个参数的更新对损失函数的下降的贡献

越小，说明这个参数不重要，可以删去。第二种方法，参数绝对值越小，说明输出特征图与

该参数几乎无关，因此可以删去。相比较而言，第一种方法是尽可能保证损失函数不变，对

结果影响相对较小，但计算复杂；第二种方法是尽可能保证每层输出特征图不变，而不管损

失函数，计算方便，但对结果可能相对较大。但无论哪种方法都需要对裁剪后网络做参数调

优。

參．低秩估计

低秩估计的方法其实就是运用了矩阵分解和矩阵乘法的结合律。此时我们仍需要回到图

1 左侧的示意图：对输入矩阵我们无法做分解，因为不同的前向传递中矩阵是变化的，但是

参数矩阵是固定的呀，那么何不分解参数矩阵呢？低秩估计就是这么个想法：

  





 

󰇛





󰇜

󰇛  󰇜    



看上面的这个式子是不是感觉特别简单，只要我们可以用若干小矩阵对参数矩阵进行估

计，那么输出矩阵就可以通过上面的式子得到。

在当前的很多对低秩估计的研究中，笔者认为奇怪的一点是：对矩阵分解后，将分解后

的矩阵乘法又转回成卷积操作，例如上式中将原参数矩阵分解成 3 个小矩阵，那么在实现中

就是用 3 个卷积来实现分解后的矩阵乘法。笔者认为这种操作实际上是增加了计算量，因为

剩余10页未读，继续阅读

SIGAI_csdn

粉丝: 2351
资源: 45

优化存储与计算：卷积神经网络压缩与加速策略探讨

xilinx Vivado HLS技术用户手册

基于verilog的卷积神经网络加速器

两层的卷积神经网络文本分类器和卷积神经网络分类器有什么不同（优点及缺点）

深度卷积神经网络的未来研究方向

用基于FPGA的yolo卷积神经网络实现人脸识别包括哪几部分

给我详细介绍一下卷积神经网络

卷积神经网络的基本构成

卷积神经网络改进的方向

什么是轻量卷积神经网络

python一维卷积神经网络

基于matlab的卷积神经网络结合gru时序算法

卷积神经网络中的优化问题

卷积神经网络中的stride参数应该如何修改？

请系统性的阐述用于图像分类的卷积神经网络的结构

电影评论情感分类 卷积神经网络text-cnn 模型 tensorflow

写一下神经网络的研究现状

写一个神经网络性能优化的文章提高

dhu神经网络与深度学习

QCNN可不可以作为一种卷积层

开源的知识蒸馏代码库

最新资源

电影评论情感分类卷积神经网络text-cnn 模型 tensorflow