深度神经网络权重剪枝：乘子交替方向法的应用

161 浏览量更新于2024-06-20 收藏 732KB PDF 举报

"这篇论文提出了一种基于乘子交替方向法(ADMM)的深度神经网络(DNN)权值剪枝系统，旨在解决DNN模型过大、计算需求高的问题。作者将权重修剪问题视为非凸优化问题，并通过ADMM框架进行系统化处理，保证了权重减少率和收敛时间。实验结果显示，这种方法在保持模型准确性的同时，能够大幅减少模型大小和计算量。" 在深度学习领域，深度神经网络(DNN)因其强大的表达能力和在各种任务上的优秀表现而备受瞩目。然而，DNN模型的庞大规模和高计算需求成为了在资源有限的设备上部署这些模型的主要障碍。为了解决这一问题，研究者们提出了各种模型压缩技术，其中权重剪枝是一种有效的方法。传统的权重剪枝工作通常是启发式和迭代的，它们在减小模型大小的同时可能无法保证模型性能。而这篇论文提出的新框架则采用乘子交替方向法(ADMM)，将权重修剪问题转化为非凸优化问题来解决。ADMM是一种优化算法，它能够将复杂问题分解为更易于管理的子问题，从而实现快速收敛。具体来说，作者首先将DNN的权重修剪问题定义为具有组合约束的非凸优化问题，这些约束确保了特定的稀疏性要求。接着，他们利用ADMM框架将这个优化问题分解为两个子问题，一个是可以通过随机梯度下降法解决的子问题，另一个则可以使用解析法求解。这种分解策略使得算法能够在保持模型准确性的前提下，有效地进行权重修剪。实验部分，该方法在MNIST数据集的LeNet-5模型上展示了显著的成果，实现了71.2倍的权重减少而不影响精度。在更复杂的ImageNet数据集的AlexNet模型上，该方法能实现21倍的权重降低，同样无精度损失。特别关注卷积层的修剪时，计算量得以大幅降低，相比于之前的工作减少了五倍（卷积层中权重减少13.4倍）。这篇论文提供了一个系统化的、基于ADMM的权重修剪框架，它为DNN模型的压缩提供了理论保证，同时保持了模型的性能。这种方法对于在资源受限的设备上部署DNN模型，如嵌入式系统和物联网设备，具有重要的实际应用价值。相关代码和模型已在GitHub上公开，为其他研究者提供了可复现性和进一步研究的基础。关键词包括：系统权重剪枝、深度神经网络、乘子交替方向法。

T. Zhang等人

因为

（

）

是可区分的，并且

（

）

是不可区分的，但具有可

利用的

结构性质。

的常见例子是

范数和约束集的指示函数。为了使其适合

ADMM的应用，我们使用变量分裂将问题重写为

尽量减

少

，

（x）+

（z）

，

服从x =z

。

接下来，通过引入增广拉格朗日量，上述优化问题可以分解为x和z中

的两个子问题[2]。第一子

问题是最小化

（

）

（

）

，

其中

（

）

是

它的一个

自

适应

函数

论点由于

和

是可微的，所以第一子问题可以通过广义离散来求

解

。

子问题的

求解是

最

小化

（z）

，

其中

（

）

是其自变量的二次函数。在

具有某种特殊结构的问题中，例如，如

果它是（1）中的正则化子，则利用

可以允许分析地解决该问题。

关于ADMM在权重修剪问题中的应用的更多细节将在第4.2节中展

示。

问题表述和拟议框架

4.1

权重剪枝的问题形式化

考虑

层DNN，其中第

（卷积或全连接）层中的权重集合由

表示，

并且第

层中的偏置集合由

表示。在卷积层中，权重被组织在四维张

量中，并且在全连接层中，它们被组织在二维矩阵中[18]。

假设（全连接）DNN的输入是x。x的每一列对应于训练图像，并

且列的数量

确定输入批次中的训练图像的数量。输入x将进入第一

层，第一层的输出由下式计算

=σ（W

x + b

）

，

其中

和

具有t列，

是具有相同列的矩阵。

在现有

技术的DNN

中，非

线性代数函数

（

）是一个非常

简单的

代数

，

并且通常被选

择为ReLU函数[22]由于一层的输出是下一层的输入，因此第i层的

输出（i

，

. . .

，

N − 1由下式给出

= σ（W

−

+ b

）

。

对应于一批图像的DNN的输出是

s= W

−

+ b

。

剩余15页未读，继续阅读

cpongm

粉丝: 6

深度神经网络权重剪枝：乘子交替方向法的应用

加速稀疏信号恢复：基于乘子方向不精确交替的新算法

IFNuke网站源码：基于DNN的CMS系统

基于知识图谱与DNN的简历推荐系统源码解析

算法剪枝-基于乘子交替方向法ADMM实现的DNN算法剪枝-附项目源码-优质项目实战.zip

智能边缘计算中基于空间和通道关注度的DNN通道剪枝的python源码

基于LabVIEW与OpenCV的dnn推理，支持Yolov5并行处理多个模型，CPU/GPU并行加速，快速识别视频与图片，灵活替换模型文件,基于LabVIEW与OpenCV的dnn推理框架，支持YO

基于深度神经网络（DNN）的多输出数据回归预测算法Matlab代码实现（适用于Matlab 2018及以上版本）,基于深度神经网络（DNN）的多输出数据回归预测算法matlab代码示例（适用于2018

基于深度神经网络（DNN）的多输出数据回归预测算法Matlab代码实现（适用于Matlab 2018及以上版本）,基于深度神经网络(DNN)的多输出数据回归预测 matlab代码，要求2018及以上版

yolo-fastest-xl-based-on-opencv-DNN-using-onnx:yolo-fastest-xl基于基于onc的opencv DNN

基于非均匀MCE准则的DNN关键词检测系统中声学模型的训练.docx

最新资源