FPGM：基于几何中值的滤波器压缩方法，提升CNN效率

167 浏览量更新于2024-06-19 收藏 1.13MB PDF 举报

"本文主要介绍了一种新的滤波器压缩方法——FPGM（Filter Pruning via Geometric Median），该方法针对深度卷积神经网络（CNN）中的滤波器进行剪枝，旨在降低模型的计算复杂度，提高运行效率。传统方法通常依据滤波器的范数大小来判断其重要性，而FPGM则不依赖这两个要求：滤波器的范数偏差大和最小范数小。实验表明，FPGM在保持模型性能的同时，能有效减少FLOPs，适用于CIFAR-10和ILSVRC-2012数据集上的ResNet模型。" 在深度学习领域，尤其是计算机视觉任务中，深度卷积神经网络（CNN）由于其强大的表达能力而广泛应用。然而，随着网络深度和宽度的增加，计算成本也随之增加，这限制了模型在资源有限的设备上的部署。因此，研究如何压缩模型，减少计算量成为了一个重要的课题。传统的滤波器压缩方法通常基于“小范数不重要”原则，即认为范数较小的滤波器对模型的贡献不大，可以被剪枝。然而，这种方法的有效性依赖于两个假设：滤波器的范数偏差较大，且最小范数趋向于0。在实际应用中，这些条件可能不总是成立。 FPGM方法则提出了一种不同的策略。它通过几何中值（Geometric Median）来确定哪些滤波器是冗余的，而不是简单地依赖于范数的大小。几何中值是一种统计概念，用于找到一组点的“中心点”，在某些方面比算术平均数更具鲁棒性。FPGM利用这一特性，修剪那些在滤波器集合中位置相对“孤立”的滤波器，而不是仅仅关注它们的范数大小。在CIFAR-10数据集上，FPGM在ResNet-110模型上实现了超过52%的FLOP减少，同时仅损失2.69%的精度，这是显著的优化。在ILSVRC-2012年数据集的ResNet-101模型上，FPGM能够在不降低前5名精度的情况下减少超过42%的FLOP，优于现有的先进水平。该研究不仅提出了一种新颖的滤波器剪枝方法，还为CNN模型的压缩提供了一种更灵活、鲁棒的策略。通过FPGM，模型可以实现更高的计算效率，适应资源受限的环境，这对于移动设备和边缘计算场景尤为重要。源代码已在GitHub上开源，供研究者和开发者进一步探索和应用。

展开

4342







def

我们的方法不受此限制。(2)选择修剪通道后，[38]需要

微调以减少性能下降。然而，我们的方法结合了修剪操

作与正常的训练过程。因此，不需要额外的微调。

(3)[38]需要计算比例因子的梯度;因此大量的计算成本是

不可避免的，而我们的方法可以在不计算比例因子梯度

的情况下加速神经网络。

方法

3.1.

预赛

我们在这一小节中正式介绍符号和记号

. 我们假设

一个神经网络有

层。我们

使用

和

分别表示

第 i 个卷积层的输入通道

和输出通道的数量。

，

表

示第i层的第

个

滤波器，

则

滤波器

，

的维数

为

<$K

，其中

是网络1

的核大小。网络

（

）

的第i 层可用

{Fi

，

≤

}

表示

深度CNN网

络的连接张量可以是

由

{

（

）

∈

，

≤

}

参数化

。

3.2.

基于范数的准则

图1说明了成功利用基于规范的标准的两个要求。然

而，这些要求并不总是成立的，它可能会导致意想不到

的结果.图2详细说明了这一点，其中蓝色虚线和绿色实

线分别表示理想和实际情况下的范数分布。

图2（b），v

→0。在这种情况下，那些被认为是

最不重要的过滤器仍然对网络有重要的贡献，这意味着

每个过滤器都是高度重要的。

信息丰富。因此，修剪那些具有最小范数值的过滤器将

对网络产生负面影响。

3.3.

真实场景

在图3中，从在CIFAR-10上预训练的ResNet-110和在

ILSVRC-2012上预训练的ResNet- 18收集的统计信息证

明了先前的分析。绿色的小垂直线表示该范数分布中的

每个观测值，蓝色曲线表示Kernel分布估计（KDE）

[30]，这是一种估计随机变量概率密度函数的非参数方

法。给出了两种结构中首层和末层的范数分布。此外，

为了清楚地说明范数点之间的关系，使用了两个不同的

x尺度，

即，

线性x标度和对数x标度。

(1)

网络中的小范数偏差

。对于ResNet-110的第一卷

积层，如图3（b）所示

存在大量的滤波器，其范数集中在10

- 6

的幅度附近。

对于ResNet-110的最后一个卷积层，如图3（c）所

示，norm值的区间跨度约为0.3，远小于第一个卷积

层的范数的区间跨度。

层（1.7）。对于ResNet-18的最后一个卷积层，如图3

（g）所示，大多数滤波器范数在区间[0. 八，一。0]。

在所有这些情况下，滤波器分布得太密集，这使得难以

选择适当的阈值来区分重要的滤波器与其他滤波器。

(2)

网络中的最小范数

。最后一个骗局-

数量的滤波器



值

数量的滤波器





值

在ResNet-18的卷积层中，如图3（g）所示，这些滤波

器的最小范数约为0.8，这与第一卷积层中的滤波器（图

3（e））相比较大。对于ResNet-110的最后一个卷积

层，如图3（c）所示，只有一个滤波器是任意小的，















规范















nor m

而其他的则不是。在这种情况下，文件-

问题

：



（



）



（）



(a)

小范数偏差

概率

：

最



小值







(b)

大最小范数

虽然根据基于规范的标准，具有最低规范的指标相对不

那么重要，但仍然使

图

基于规范的标准的理想与现实：（

）小

范数偏差和（

）大最小范数。蓝色虚线表示理想的正态分

布，绿色实线表示实际情况下可能出现的正态分布

(1)

标准偏差较小

。滤波器范数分布的偏差可能太

小，这意味着范数值集中在一个小区间，如图2（a）所

示。小的范数偏差导致小的搜索空间，这使得难以找到

合适的阈值来选择滤波器进行修剪。

在网络上做出了巨大贡献。

3.4.

基于几何中值的

为了摆脱基于范数准则的约束条件，我们提出了

一种新的过滤器修剪方法的启发，从几何度量中值。

几何中值 [8] 的中心思想如下

：给定一个 n 点集

（

）

，

. ...

...、

（

）

，每个

（

）

∈

，找到一个点x

∈

，使

Euclidean distances to them：

(2)

大最小

范数具有最小范数的滤波器可能不是任意

小的，如图所示

全连接层等于k= 1的卷积层

≠

arg min

（

）其中

（

）

，

]

（

一

）

第

二

章

（

）

下载后可阅读完整内容，剩余14页未读，立即下载

身份认证购VIP最低享 7 折!

30元优惠券

cpongm

粉丝: 5
资源: 2万+

FPGM：基于几何中值的滤波器压缩方法，提升CNN效率

基于FPGA的图像压缩算法研究

H 无穷范数：非迭代方法：使用 MATLAB 对线性系统的无穷范数进行替代（系统）计算。-matlab开发

l2范数matlab源码-LTVTools:线性时变系统工具箱

加权核范数提升面部幻觉效果：WNCSC模型与算法优化

Matlab L1范数凸优化工具包：压缩感知应用

基于迭代加权L1范数的稀疏阵列综合：减小阵元数量与提高效率

稀疏FIR滤波器的创新设计：兼顾稀疏度与阶次优化

L1范数超分辨率图像重建：Matlab源码实现与仿真

L1范数稀疏隐空间SVM：高效推广与快速评估

L1-L2范数增强鲁棒目标跟踪：解决稀疏原型遮挡问题

最新资源