统一模型：分解卷积滤波器压缩CNN

PDF格式 | 12.13MB | 更新于2025-01-16 | 187 浏览量 | 举报

"本文主要探讨了如何通过分解卷积滤波器来压缩深度卷积神经网络（CNNs），以实现模型的小型化和高效运行。文章指出，传统的滤波器修剪方法通常包括预训练、滤波器选择和微调三个阶段，但这种方法难以精确控制性能。作者提出了一种新的统一模型，将滤波器选择和学习过程结合在一起，引入了分解卷积滤波器（FCF），它由标准实值卷积滤波器和二进制标量组成，并利用反向传播和交替方向乘子法（ADMM）优化更新这两个部分。通过在CNN-FCF模型上训练，仅保留与二进制标量值为1对应的滤波器，从而得到紧凑的CNN模型。实验结果表明，这种方法在CIFAR-10和ImageNet数据集上的表现优于当前最先进的滤波器修剪技术。" 深度卷积神经网络（CNNs）是图像识别、语义分割、目标检测等计算机视觉任务中的关键模型，但由于其庞大的参数数量和计算复杂度，使得在移动设备上应用变得困难。为了解决这一问题，模型压缩成为了重要的研究方向。传统的模型压缩方法如滤波器修剪，一般涉及预训练、选择和微调阶段，但这种分离式处理方式可能导致性能难以控制。文章创新性地提出了分解卷积滤波器（FCF），它将滤波器分解为标准实值卷积滤波器和二进制标量，通过点积操作连接。在训练过程中，FCF允许同时进行滤波器选择和学习，通过反向传播更新实值滤波器，而二进制标量则用ADMM优化方法更新。这样，在训练完成后，只保留与二进制标量为1的滤波器，可以有效减少模型参数，实现CNN的压缩。实验部分，研究者在CIFAR-10和ImageNet两个广泛使用的图像识别数据集上验证了该方法的有效性，证明了提出的CNN-FCF模型在压缩率和性能之间达到了更好的平衡，超越了现有的滤波器修剪技术。该研究提供了一个新的滤波器压缩策略，有助于在不牺牲性能的前提下，减小深度学习模型的体积，使之更适合于资源有限的设备，如手机和嵌入式系统。未来的研究可能会进一步探索如何优化FCF结构，或者将其与其他模型压缩技术（如量化、低秩分解等）相结合，以实现更高效、更轻量级的深度学习模型。

展开

3977

通过分解卷积滤波器压缩卷积神经网络

李团辉1吴宝源2杨玉久1范彦博2张勇2刘伟2

1清华大学深圳研究生院2腾讯AILab

lth17@mails.tsinghua.edu.cn,wubaoyuan1987@gmail.com,yang.yujiu@sz.tsinghua.edu.cn,

{fanyanbo0124,zhangyong201303}@gmail.com,wl2223@columbia.edu

摘要

本文研究了通过滤波器修剪对深度卷积神经网络（CNNs）

进行模型压缩。传统修剪的工作流程包括三个连续的阶段：

预训练原始模型，根据手动设计的准则（例如滤波器的范数

）对预训练的滤波器进行排序选择，以及通过微调学习剩余

的滤波器。大多数现有的工作都遵循这个流程，并专注于设

计不同的滤波器选择准则。然而，由于滤波器选择和滤波器

学习的分离，很难控制性能。在本文中，我们提出同时进行

滤波器选择和滤波器学习的统一模型。为此，我们定义了一

个分解卷积滤波器（FCF），由一个标准的实值卷积滤波器

和一个二进制标量以及它们之间的点积运算符组成。我们使

用反向传播更新标准滤波器，同时使用基于交替方向乘子法

（ADMM）的优化方法更新二进制标量。通过训练带有分

解卷积滤波器（CNN-FCF）的CNN模型，我们只保留与值

为1的标量对应的标准滤波器，而丢弃所有其他滤波器和所

有二进制标量，以获得一个紧凑的CNN模型。在CIFAR-10

和ImageNet上进行了大量实验证明了所提方法优于最先进

的滤波器修剪方法。

1.引言

近年来出现了许多流行的深度卷积神经网络，例如VGGNet[

32]和ResNet[10]等。这些模型在许多视觉任务上显示出有

希望的结果，例如图像分类[18,36,37,39]。

表示通讯作者。本工作是李团辉在腾讯AILab实习期间完成的。

语义分割[2,26]，目标检测[6]，目标跟踪[22,

43]或视觉推理[34,

42]。然而，这些深度模型的模型大小和计算复杂度也呈指

数增长。例如，ResNet-152[10]包含大约6000万个参数和

113亿次浮点运算（FLOPS），这使得这些模型无法应用于

移动系统。解决这个问题的可行方法是模型压缩，其目标是

在尽可能保持模型性能的同时减少参数。

在深度卷积神经网络的模型压缩领域，已经开发出许多具有

开创性的工作。它们通常可以分为四个类别，包括修剪[8,

12,21,23,27]，低秩分解[16,19,45]，权重量化[24,

25]和紧凑网络设计[13,

28]。本文重点研究修剪方法，并将读者引导至[4]以获取有

关其他类别的更多细节。具体而言，我们关注滤波器级别的

修剪（滤波器修剪），它修剪了滤波器张量的输出通道。滤

波器修剪的典型工作流程如图1（顶部）所示。它包括三个

连续的阶段，包括原始模型的训练，根据手动设计的排序准

则修剪滤波器，以及使用剩余滤波器进行微调的模型。许多

现有的工作都集中在设计不同的排序准则上。然而，这些准

则大多数依赖于权重值本身或预训练原始模型的结果（例如

分类准确性）。一个典型的准则是假设具有较小“权重”范

数的滤波器对模型的贡献较小，因此可以被修剪[21]。然而

，据我们所知，我们从未找到对这个假设的严格验证。更重

要的是，手动设计的排序准则仅依赖于预训练原始模型，而

不依赖于修剪模型的后续微调过程。排序准则的有效性

下载后可阅读完整内容，剩余9页未读，立即下载

身份认证购VIP最低享 7 折!

30元优惠券

cpongm

粉丝: 5

统一模型：分解卷积滤波器压缩CNN

卷积滤波器在模型压缩与加速技术中的应用研究进展

压缩卷积神经网络：基础学习与性能探究

深度学习网络压缩新方法：滤波器组近似压缩技术

用卷积滤波器matlab代码-model-compression-and-acceleration-progress:模型压缩与加速进行

用卷积滤波器matlab代码-model-compression-and-acceleration-progress:信息库以跟踪模型压缩和加

卷积神经网络压缩技术的研究与实现1

卷积神经网络算法模型的压缩与加速算法比较1

卷积神经网络算法模型的压缩与加速算法比较.pdf

深度学习实践：卷积神经网络详解

网络压缩新视角：滤波器修剪与低秩分解的组稀疏性分析

最新资源