混合精度量化：约束优化新框架与性能提升

PDF格式 | 843KB | 更新于2024-06-19 | 40 浏览量 | 举报

"该文研究了基于约束优化的神经网络混合精度量化技术，旨在提高深度学习模型在低精度计算下的性能和效率。传统的量化方法通常采用统一的比特宽度，但这种方法在超低精度下可能损失准确性，且未充分利用新兴硬件对混合精度计算的支持。文章提出了一种新的混合精度量化框架，将此问题形式化为离散约束优化问题，并通过泰勒展开和哈希矩阵计算进行优化。最后，该问题被转换为多选择背包问题（MCKP），并采用贪婪搜索算法求解。实验结果表明，该方法在ImageNet数据集和多种网络架构上优于现有的一致性和混合精度量化方法，且适用于实时应用中的CNN压缩和加速。" 在深度学习领域，尤其是在计算机视觉任务中，卷积神经网络（CNN）已经成为主导技术，但随之而来的是计算复杂度和存储需求的增加。为了应对这一挑战，研究人员提出了一系列压缩和加速CNN的方法，其中包括量化技术。量化通过将浮点数权重和激活转换为低精度定点数来减少存储和计算需求，同时尽可能保持模型性能。传统的量化方法往往采用固定比特宽度，这意味着所有层都使用相同精度的权重和激活表示。然而，这种做法可能存在局限性，因为不同层的敏感性和冗余度可能不同。因此，使用混合精度量化可以更好地适应这些差异，允许不同层使用不同精度，从而提高整体性能。本文提出的新框架首先将混合精度量化视为离散约束优化问题，这意味着需要在满足特定条件（如保持模型精度）的同时最小化比特宽度的总和。接着，通过目标函数的二阶泰勒展开，作者简化了优化过程，有效地计算了哈希矩阵，这有助于解决离散优化问题的复杂性。最终，通过将问题转化为多选择背包问题，可以利用贪婪搜索策略来寻找最优的比特宽度分配方案。实验部分，该方法在ImageNet数据集上以及各种网络架构（如ResNet、VGG等）上进行了验证，结果显示，与现有的统一精度和混合精度量化方法相比，该方法能够提供更高的准确性和更快的推理速度，特别是在资源受限的实时应用中效果显著。这项工作为混合精度量化的理论基础和实践应用提供了新的视角，通过优化比特宽度分配策略，为深度学习模型的高效部署开辟了新的路径。未来的研究可能会进一步探索如何优化这种量化策略，以适应更多类型的模型和硬件环境。

展开

5352

{

}

∈

×→

联系

我们

∈

|·|

{

−

}

× {− −

}

方法

在本节中，我们首先将混合精度量化的一般其次，

针对原目标函数计算困难的问题，采用二阶泰勒展开

式对原目标函数进行逼近，并提出了一种计算原目标

函数Hessian矩阵的有效方法最后，我们将优化转化为

背包问题的一个特殊变体，称为

执行舍入到最近的操作，例如

（

，

）

夹子

（

[

w/s

，

−

）？s（无符号输入）。

3.2.问题公式化

令w

：

（

）

是具有L层的CNN为了找到以压缩或

加速为目标的最佳位宽分配，我们有以下离散约束问

题：

多选择背包问题（MCKP），并提出了一种贪婪搜索

算法来有效地解决该问题。

一个

min

（

）

（

w+ ∆w

，

（

）

，

（

）

3.1.符号和背景

S.T. ∆

（

）

Q（w

（

）

，

（

）

−

（

）

（

三

）

符号：我们假设L层卷积神经网络

（

一

）

，

的。

，

（

）

≤

网络

：

ΩX Y

和

个样本（

（

）

，

（

）

X Y

的训练

数据集，其中

n= 1

，

. . .

、

该模型

使用一些参数

θ Ω

将每个样本

（

）

映射

到预测

（

）

。然后，将预测与地

面实况

（

）

进行比较，并使用任务特定的损失函数

：

Y Y R

进行评估，例如用于图像分类的交叉熵损失

。

这导致目标函数

最小化L：

Ω

→

，

（

）

∈

∈{

，

. . .

，

}

，

∈ {

，

. . .

，

}

问题（3）是混合精度量化的一般形式。更具体地

说，不平等的约束

用于 j1

，

. . .

，

M表示我们的量

化预算，例如模型压缩、触发器减少或两者。为了与

其他混合精度方法进行公平比较，在这里我们考虑模

型压缩的约束也就是说，我们将量化目标实例化为

（

）（

）

（

）

= l

（

，

x）

，

y）

（一）

（

）

（

）

目标

（

）

（

四）

（

）

（θ）

。

特别地，对于第l

个

卷积层或全连接层，

我们将其权重

张量表示为

（

）

∈

×k×k

，将其展平版本表示为

（

）

oci

，其中

是核

size（对于全连接层等于1），

和co

分别

是输入和输出通

道的数量。

其中

，

表示

网络

的平均位宽

然而，目标函数（3）在计

算上是昂贵的，因为我们需要针对每个候选位宽分配

在整个训练数据集上评估网络。取而代之的是，它被

替换为二阶泰勒展开

量化背景：量化的目的是将浮点值映射到具有离散

元素的有限集合中。在数学上，我们可以用公式表示

一个

（

w+ ∆w

）

（

）

（

∆w

）

（

五

）

≈ L

量化函数为Q：R

→

，取

（w）

∆

w H

∆

。

全精度矢量和量化位宽作为输入，并输出量化矢量。

在本文中，我们只考虑均匀对称量化，因为它需要很

少的额外开销，在大多数硬件平台上实现。因此，Π

等于s2

−

，

. . .

、

. . .

，

1，对于有符号输入，

，

. . .

，

其中b是量化位宽，s是两个连续网格点之

间的步长。在这里，我们采用最小平方误差（MSE）

作为量化标准，并解决了以下最小化问题

minw

−

Q（w

，

b）

s.t.

Q（w

，

b）∈ Π

（2）

以获得具有给定位宽b的步长s。后可以很容易地得

到量化的矢量

下载后可阅读完整内容，剩余14页未读，立即下载

身份认证购VIP最低享 7 折!

30元优惠券

cpongm

粉丝: 6

混合精度量化：约束优化新框架与性能提升

基于误差限制的神经网络混合精度量化方法.docx

多种进化算法混合解决约束工程优化问题研究.docx

论文研究-一种求解约束优化问题的混合算法.pdf

如何理解混合精度量化在卷积神经网络中的作用以及其如何通过约束优化提升性能？

混合精度量化在卷积神经网络中的作用是什么？它是如何通过约束优化技术提升CNN性能的？

硬件感知自动化量化：混合精度神经网络优化与硬件设计

在卷积神经网络（CNN）中，混合精度量化如何通过约束优化技术来提升模型的性能？具体是如何实现的？

改进相位迭代的低精度混合预编码方法.docx

基于MATLAB的沥青混合料配合比优化设计.pdf

基于梯度理论的非线性优化研究

最新资源