SPIQ：静态输入量化实现计算机视觉任务的高精度与快速推理

81 浏览量更新于2025-01-16 收藏 883KB PDF 举报

"本文主要探讨了神经网络的静态输入量化技术，特别是在计算机视觉任务中的应用。SPIQ（Static Per-Channel Input Quantization）方法被提出，该方法旨在在不牺牲准确性的同时，实现与动态方法相当的推理速度。文章强调了在边缘设备上部署深度神经网络的挑战，以及量化作为解决这一问题的有效手段。SPIQ通过每通道输入量化策略，能够精细地保持跨通道动态，从而在多个计算机视觉任务上展现出与动态量化方法相当的精度，同时保持静态量化级别的推理效率。 1. 神经网络量化背景在计算机视觉领域，由于数据隐私和环境可持续性的考虑，部署在边缘设备上的先进深度学习模型需要更高效、更节省资源。量化技术为此提供了解决方案，它将模型的权重和输入从浮点数转化为整数，如int8或int4，以降低计算成本和存储需求。 2. 量化类型量化分为两类：数据驱动量化和训练后量化（无数据量化）。数据驱动量化依赖于实际训练数据来校准量化参数，能保持较高精度但计算成本高；训练后量化则在无额外数据的情况下进行，适合快速部署但可能牺牲部分精度。 3. SPIQ方法 SPIQ是一种静态输入量化方法，它创新性地采用了每通道量化策略，能适应不同通道的动态范围，提高静态量化的准确性。通过在多个基准任务（如ImageNet分类、Pascal VOC对象检测和CityScapes语义分割）上的实验，SPIQ在保持静态量化速度的同时，达到了动态量化方法的精度水平。 4. 边缘设备部署的挑战与解决方案由于边缘设备资源有限，对隐私保护的要求更高，因此需要轻量化、快速的推理模型。SPIQ的出现为解决这一问题提供了新思路，它在不增加计算复杂度的前提下，提升了静态量化的精度，有利于在边缘设备上高效部署DNN。 5. 结论 SPIQ作为一种静态输入量化方法，通过其独特的每通道量化策略，成功地在精度和速度之间找到了平衡，对于推动计算机视觉任务在边缘设备上的广泛应用具有重要意义。未来的研究可能会进一步优化这种量化技术，以适应更多复杂任务和硬件环境。"

3871

−

→ −

∩

›→ ⌊ ⌉

⌊·⌉

∈

⊙

−

∈

∈ {||}

，

的。

−

（2 -

1）

、

，

−

∈

、

在这项工作中，我们认为，一个重要的部分，交流-

精度损失来自输入（和激活）量化。

分别应用于

和

，

。因此，

根据这些观察结果，我们提出了SPIQ，一种通过实现

每通道输入量化方案来达到动态方法的准确度水平的

方法，该方法

方法

设F：

<$→

是定义在域

D <$

和输出空间

上的前馈神经网络。由层f

执行的操作

，对于l

∈

，

. . .

，

L}，由相应的权重张量W

∈

−1

定义

必须是缩放整个输入的单个标量值

张量

类似于权重缩放因子

，基于分布对比例的支

持来计算输入比例

s 11

。然而，在无数据量化的情

况下，我们为了规避这个限制，我们可以应用静态

或动态激活量化方案。

静态输入量化：目标是计算

其中，在全连接层的情况下，

仅为R

静态

∈

R基于

的最大值的估计

在

k k卷积层的情况下为R

k×k

。我们注意到

是

全连接

层fl的输入

。

让

我们考虑量子化算子

：

R [ β ; β

]

N ，它将实值映射到一组有界的整数值，其中 β

b−

，b定义了目标表示的位宽。标准量化算子定义

为Q：x x/s

其中是舍入操作，并且

是缩放因

子。然后，量化层

被定义为：

在域上。假设BN层在

之前，我们可以断言，

]

=β

，

]

=γ

（

）

其中，β

−1

和γ

−1

分别是BN层的中心矢量参数和

尺度矢量参数。因此，可以通过搜索输出通道上的最

大值来导出域上的

的最大值，并且我们得到，

<$→

−

（

）

（

））

，

max

∈

from

我

max

{β

λ×

}

静态

l l

I I

（

一

）

−1

−

−1

（四）

其中是元素乘积。

和

的值分别取决于

和

上可用的信息

。在权张量

dur

的情况

在量化过程中，所有的信息都是可用的。因此，s

的值

由W

导出

其中λ是灵敏度参数。这种量化方法在推理时不需要额

外的计算，而只是引入了一个非常粗略的、

静态

的

每层

缩放因子。

动态输入量化：目标是计算

为了缩放标量权重值分布，

[−

;

]

。有两个量化选项。首先，

动态

基于推断的输入

，以

输出通道权重量化，在这种情况下s

∈R

推理时的开销计算。因此

是

max

我

N 维向量，并且每个输出通道（或神经元）被独

立地缩放。第二，每层（或每层）

∈

−

−1

dynamic

∈

（

）

张量）量化，其中

，

是

缩放整个权重

张量

的标量值

。形式上，如果

注意，W

通道是

每通道量化张量，W

层

max

的计算在每个推断处执行，这增加了显著的

计算开销（参见第

4.3

节）。然而，缩放因子

每层量化张量，

max

必然比静态情况下更紧

因此具有较低的量化误差。尽管如此，我们认为

中国

台

湾

频道

钨

层

∈

=（2

b−

1）

max

∈

{|W|}

∈{

，

…

，

}

由于每个通道的重新缩放，可以设计更严格的静态输入

量化方案。

3.2.

每通道静态输入量化

哪里

是

第

柱

（二）

对应于第n

个

我们定义缩放向量

通道

−1

使用

BN层。从形式上讲，

层神经元

3.1.静态和动态输入量化

max

∈

from

我

−

−1

−

−1

通道

双

稳

态

（

六

）

来自等式

的

的定义

引入了维数，

其中

通道

∈

−1

。然而，我们再也无法

语义约束我们需要将

应用

于两个

（

执行如等式1所述的去量化，

有n

个

-1

通道），

我

是

我

是

，

即

如

果

是矢量

维度问题的原因。从形式上讲，缩放矢量-

那么

需要维数

−

和

，

、

≈

剩余12页未读，继续阅读

cpongm

粉丝: 6

SPIQ：静态输入量化实现计算机视觉任务的高精度与快速推理

TFT屏的图片，中文和字符显示（IAR）

spiflash 驱动代码

芯片中的SPIQ和SPID是什么意思

esp-idf 4.3.5,ESP32-C3FN4,如何将gpio17的spiq功能复位成普通io输入

esp-idf 4.3.5,ESP32-C3FN4,如何将gpio17的spiq功能复位成普通io

esp-idf 4.3.5,ESP32-C3FN4,设置gpio17的默认模式是spiq功能，我想通过Af模式切换成普通io

cole_02_0507.pdf

工程硕士开题报告：无线传感器网络路由技术及能量优化LEACH协议研究

【东海期货-2025研报】东海贵金属周度策略：金价高位回落，阶段性回调趋势初现.pdf

图像数据处理工具+数据(帮助用户快速划分数据集并增强图像数据集。通过自动化数据处理流程，简化了深度学习项目的数据准备工作)

最新资源