AMC：自动模型压缩技术在移动设备上的应用

19 浏览量更新于2024-06-20 收藏 797KB PDF 举报

"AMC: AutoML for Model Compression on Mobile Devices" 在当前的移动设备应用中，深度神经网络（DNNs）由于其计算需求大，往往无法在资源有限的移动平台上高效运行。模型压缩技术因此应运而生，它旨在减小模型的大小，同时保持或提高其性能，以适应移动设备的计算能力和功耗限制。传统的模型压缩方法依赖于人工设计的特征和专家经验，这不仅耗时，而且可能无法达到最优的压缩效果。 AMC（AutoML for Model Compression）是一种创新的自动化机器学习（AutoML）方法，专为移动设备上的模型压缩设计。该方法采用强化学习策略，通过智能地探索模型压缩的设计空间，以寻找最佳的层压缩策略。强化学习代理通过与环境的交互学习，即在压缩模型的同时评估性能，以优化模型的FLOPs（浮点运算次数）和准确性之间的平衡。在AMC中，强化学习代理使用Deep Deterministic Policy Gradient (DDPG)算法，这是一种基于Actor-Critic框架的强化学习算法，能够有效地处理连续动作空间的问题。在模型压缩过程中，代理在每一层选择合适的压缩率（例如50%的稀疏率），并根据压缩后模型的性能（如错误率）来更新其策略。通过这种方式，AMC能够在不断试错中逐步优化模型，实现更高效的压缩。实验结果显示，AMC在ImageNet数据集上对比VGG-16的手动压缩方法，实现了4×FLOPs减少的同时，精度提升了2.7%。这意味着AMC能够自动找到比人工设计更好的压缩方案。将这种方法应用到MobileNet-V1上，AMC在GPU上实现了1.53倍的加速，在Android手机上则达到了1.95倍的加速，而且几乎不牺牲模型的准确性。 AMC的自动化特性显著减少了人工参与的需求，使得模型压缩过程更加高效。通过消除人工设计的启发式方法，AMC能够探索更大规模的设计空间，从而获得更好的压缩性能。这一方法对于推动移动设备上的深度学习应用具有重大意义，因为它简化了模型优化的过程，使得开发者可以更快地部署和运行复杂的神经网络模型，而不必担心计算资源的限制。关键词：自动机器学习（AutoML）、强化学习、模型压缩、卷积神经网络（CNN）加速、移动设备视觉应用。

Yihui He，Ji Lin，Zhijian Liu，Hanrui Wang，Li-Jia Li and Song

Han

10，41]和特殊的卷积实现[36，48，29，3]也可以加速

神经网络。张量因子分解[30，15，27，35]将权重分解为轻量级部

分，例如[51，11，14]提出用截断SVD加速全连接层;Jaderberg

等人

。

[26]提出将层分解为1×3和3×1; Zhang

et al

.[53]建议将层分解为3×3和

1×1。通道修剪[40，24，1，38]从特征图中移除冗余通道。这些方法

的一个共同问题是如何确定每一层的稀疏比。

神经架构搜索和AutoML。许多关于

使用强化学习和遗传算法

搜索模

型的工作

[46，42，5，37

]极大地提高

了神经网络的性能NAS

[57]

旨在

搜索可转移的

网络块，其性能超过许多

手动

设计的架构

[47，21，

9]。Cai等人[

提出通过网络改造加快勘探速度

[8]。

受其启发，N2N

[2]

将强化学习集成到通道选择中。在表1中，我们展示了我们的AMC

引擎的几个优点。与以前的工作相比，AMC引擎优化了准确性

和延

迟，需要一个简单的非RNN控制器，可以用更少的GPU时间进行快

速探索，并且还支持连续的动作空间。

方法

我们在图1中概述了AutoML for Model Compression（AMC）引擎。我们

的目标是自动找到每一层的冗余，characterized稀疏。我们训练了一个

强化学习代理来预测动作并给出稀疏度，然后执行剪枝。我们迅速评

估修剪后的准确性，但在微调作为最终准确性的有效代表然后，我们

通过鼓励更小，更快，更准确的模型来更新代理。

3.1

问题定义

模型压缩是通过减少深度神经网络中每层的参数数量和计算量来实现

的。修剪有两类：细粒度修剪和结构修剪。

细粒度修剪

[19]旨在修剪权重

张量中的单个不重要元素，这能够实现非常高的压缩率而不损失准确

性。然而，这样的算法会导致不规则的稀疏模式，并且需要专门的硬

件，

如EIE [18]来加速。粗

粒度结构化修剪

[31]旨在修剪

权重张量的整个规

则区域（例如通道、行、列、块

等

）。修剪后的权重是规则的，可以直

接用现成的硬件和库来加速。在这里，我们研究结构化修剪，收缩每个

卷积层和全连接层的输入通道。

我们的目标是精确地找出每个层的有效

稀疏度

，这在以前的研究中是

手动确定的 [38 ， 31 ， 22] 。以卷积层为例。权重张量的形状是

n×c×k×k，其中n、c是输出和输入通道，k是核大小。对于细粒度修

剪，稀疏度被定义为零元素的数量除以零元素的数量。

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

AMC：自动模型压缩技术在移动设备上的应用

YOLOv8 Deployment on Embedded Devices: Hardware Acceleration and Model Compression

amc:[ECCV 2018] AMC

信号处理之压缩算法：JPEG压缩 (JPEG Compression).zip

A simple code for Audio Compression using DCT:A simple code for Audio Compression using Discrete Cosine Transform (DCT) and evaluation by psnr, mse-matlab开发

awesome-ml-model-compression:很棒的机器学习模型压缩研究论文，工具和学习材料

AMC: 深度学习模型压缩的AutoML技术

ASTC HDR纹理压缩官方规范：KHR_texture_compression_astc_hdr详解

Deployment and Optimization of YOLOv8 Model on Mobile Devices

Deep Learning Model Compression Techniques: How to Reduce Model Size While Maintaining Performance

error: cannot find module 'compression-webpack-plugin'

最新资源