ACL'22 | 陈丹琦的CoFi模型剪枝：10倍加速，精度无损

版权申诉

135 浏览量更新于2024-08-04 收藏 2.68MB PDF 举报

"ACL'22 _ 陈丹琦提出CoFi模型剪枝，加速10倍，精度几乎无损" 在当前的AI科技领域，深度学习模型的规模不断增大，这导致了推理速度变慢和计算资源的需求增加。为了应对这一挑战，研究人员一直在探索模型压缩技术，以提高模型的效率。模型剪枝和模型蒸馏是两种常见的模型压缩方法。陈丹琦在ACL'22大会上提出的CoFi模型剪枝方法，旨在解决传统剪枝方法加速效果有限以及模型蒸馏训练成本高的问题。传统的模型剪枝策略通过移除对模型预测影响较小的参数来减少模型大小，然而，这种方法通常只能实现2-3倍的加速比，且可能牺牲一定的精度。另一方面，模型蒸馏虽然能提供更大的加速比，保持较好的推理精度，但需要大量无标签数据进行预训练，增加了训练成本。陈丹琦的CoFi（Confidence-based Filter Pruning）模型剪枝方法则提供了一个新颖的解决方案。该方法的核心思想是基于参数的置信度来进行剪枝，通过对模型参数的重要性进行更精准的评估，实现更大程度的压缩，同时保持近乎无损的精度。论文《Structured Pruning Learns Compact and Accurate Models》详细介绍了这种方法，它通过结构化剪枝策略，不仅显著提高了模型的加速比，达到了10倍之多，而且还有效地控制了精度损失。在实际应用中，CoFi剪枝技术可能对边缘计算设备特别有益，这些设备通常资源有限，需要高效运行的模型。此外，由于其降低了训练成本，CoFi也适用于那些数据获取和计算资源有限的场景。通过这种方式，陈丹琦的这项工作为深度学习模型的优化提供了新的思路，有望推动AI技术在效率与性能之间找到更好的平衡。论文链接和GitHub地址分别为：https://arxiv.org/pdf/2204.00408.pdf 和 https://github.com/princeton-nlp/CoFiPruning，感兴趣的读者可以深入研究，了解具体的技术实现和实验结果。这一创新方法的出现，对于AI领域的模型优化和实际应用具有重要的意义。

2023/6/28 22:33

ACL'22 | 陈丹琦提出CoFi模型剪枝，加速10倍，精度几乎无损

https://mp.weixin.qq.com/s/0VO036qHI8JYfYu_r-3Tgw

3/13

attention，MHA)和两个前馈神经网络(FFN)组成。其中， MHAs 和 FFNs 的参数量比为 1:2。

在 GPU 上，两者的推理时间基本相同，而在 CPU 上， FFNs 则会耗费更多的推理时间。

正如前面所述，模型压缩可以归纳为两种方法：知识蒸馏和剪枝。知识蒸馏在通常情况下，需

要预先定义一个结构固定的学生网络（当然，也有一些尝试动态学生网络的研究），通过用

大量无标签数据预训练学生网络的方式进行模型参数初始化，然后用任务特定的带标签数据微

调学生模型，当然，学生模型的初始化方式可以有很多种，例如用教师模型的某些层初始化学

生模型等，但基本的解决思想是一致的。

剪枝则指的是从原模型中去除冗余的参数，按照剪枝的粒度可以分为以下几种：

1. 层剪枝（layer pruning）：从模型中删去整个 block 块（包括 MHA 和 FFN ），一些研究

表明，去除 50% 的层并不会有太多的精度下降，而且还可以获得 2X 的加速比；

2. 头剪枝（head pruning）：通过 mask 矩阵只保留一部分 head，但研究表明，这种做法并

不能带来较大的加速比，当仅保留一个 head 的时候，加速比为 1.4X；

3. 前馈神经网络剪枝（FFN pruning）：去除整个 FFN 层或者去除 FFN 层的某些维度；

4. 更加细粒度的块和非结构化的剪枝：去除 MHA 和 FFN 中更小的块或者去除某些参数权

重，目前这种做法很难优化模型，也难以获得推理加速

除此之外，还可以将剪枝和蒸馏融合起来，但目前，该方法具体实现尚不清晰。

结构化剪枝方法 CoFi

为获得较大的加速比和较低的精度损失，以及缓解模型训练成本过高的问题，作者提出了

结构化剪枝方法 CoFi (Coarse- and Fine-grained P runing)，方法由两个部分组成：粗粒度和

细粒度的剪枝以及从原模型（未剪枝）到剪枝模型的逐层蒸馏

粗粒度和细粒度的剪枝

在头剪枝（head pruning）中，经常通过由

，

组成的 mask 矩阵来保留一部分 head ，

但是，当 mask 矩阵全为 0，即去除掉所有的 head 时，会使模型优化变得困难。为此，作者

为每一层的 MHA 和 FFN 引入两个掩码变量和，多头自注意力和前馈神经网络可

以表示为：

剩余12页未读，继续阅读

地理探险家

粉丝: 1253
资源: 5601

ACL'22 | 陈丹琦的CoFi模型剪枝：10倍加速，精度无损

ACL'22 _ 陈丹琦提出CoFi模型剪枝，加速10倍，精度几乎无损.rar

2008_陈丹琦_基于连通性状态压缩的动态规划问题_Cdq

陈丹琦团队新作：单卡A100可训300亿参数模型啦！.pdf

陈丹琦团队新作：单卡A100可训300亿参数模型啦！

陈丹琦“简单到令人沮丧”的屠榜之作：关系抽取新SOTA！.rar

陈丹琦博士毕业论文，机器阅读理解

基于连通性压缩的动态规划：陈丹琦研究进展

陈丹琦实现关系抽取新突破，技术革新令人瞩目

陈丹琦弦图与区间图详解：消除序列与性质探讨

中国新能源汽车&充电桩（2018-2022）数据-最新出炉.zip

最新资源