COBLA：深度学习中的约束优化低秩近似方法

179 浏览量更新于2024-06-20 收藏 693KB PDF 举报

"基于约束优化的深度神经网络的低秩近似方法，旨在在保持性能的同时，降低深度学习模型的计算成本和存储需求。本文提出了一种名为COBLA（基于约束优化的低秩近似）的新方法，该方法通过找到最佳的低秩近似来优化训练好的卷积神经网络，同时考虑MAC操作次数和内存占用的限制。COBLA通过奇异值分解和二进制掩码变量来决定哪些奇异值和奇异向量应在低秩近似中保留，形成一个0-1整数规划问题，并使用序列二次规划进行求解。这种方法无需额外的超参数，并在实验中表现出优于现有技术的性能，尤其是在SqueezeNet和VGG-16架构上处理ImageNet数据集时。低秩近似技术对于减少深度学习模型的复杂性至关重要，但如何在约束条件下确定每层的目标秩是一个挑战，COBLA提供了解决这一问题的有效途径，它将资源分配视为一个优化问题，合理分配计算和存储资源给网络的不同层。" 在深度神经网络(DNN)领域，模型的复杂性和庞大的计算需求常常成为部署到边缘设备的主要障碍。低秩近似作为一种有效的压缩策略，通过识别并去除权重矩阵中的冗余信息，降低了模型的计算和存储开销。然而，如何在保持模型性能的前提下，有效地进行低秩近似是一大难题。 COBLA算法采用了一种系统的方法来解决这个问题。首先，它对网络权重执行奇异值分解(SVD)，这能够揭示权重矩阵的结构并提取其最重要的特征——奇异值和奇异向量。接着，通过引入二进制掩码变量，COBLA能够表示在低秩近似中哪些奇异值及其对应的奇异向量应当被保留或忽略。这个掩码变量与计算成本和存储成本的约束相结合，形成一个0-1整数规划问题，其中每个层的资源分配被优化以满足给定的MAC操作和内存占用限制。序列二次规划(SQP)被用来近似解决这个非线性优化问题。SQP是一种数值优化方法，它通过迭代的方式逐步改进解的质量，尤其适合处理约束优化问题。COBLA的独特之处在于它不依赖于手动调整超参数，而是自动地在资源分配和模型性能之间寻找平衡。实验结果表明，COBLA在ImageNet分类任务上表现出色，与SqueezeNet和VGG-16这样的广泛使用的网络架构兼容，且优于现有的低秩近似技术。这表明，COBLA不仅能有效地压缩模型，还能保持或提高模型的预测精度，这对于在资源受限的环境中部署深度学习模型具有重要意义。 COBLA是一个创新的、系统化的解决方案，它将深度学习模型的低秩近似与约束优化相结合，为解决计算成本和存储成本的问题提供了新的视角。这种方法有望在未来的边缘计算场景中发挥重要作用，使得高效的深度学习模型能在各种设备上更广泛地应用。

Chong Li和C.J.施仲宏

乐

不

^ ^

您的位置：

′

（

）

′

（

）

不

哪里

| · |表示

集合的基数。默认技术是截断奇异值，其中

，

通过调整

超参数ki来选择

，

使得

在

，

{

≤k

}

[

27，

30]

。

通常，

考虑到加权低

秩近似问题的NP-困难性，运行单个全局值是次优的[31]。值得强调的

是，

是一个超参数，必须针对网络中的每个卷积层单独调整。给定

网络中的大量层，针对每一层最优地调整

，

本身构成具有挑战性的

整数优化问题COBLA可以被认为是一种自动选择

，

的方法，为每一

层的约束条件。

等效地，等式2可以重写为

[

′

，

：

，

：

，

′

]

∈

，

′

（P

日

′

（

三

）

其中

∈

，

1}是奇异值及其对应奇异向量的

掩蔽变量

，其中

1指示第

个卷积层的

第j

个奇异值被包括在近似中，否则

0。显然，对于第i个卷积层

，

{

1}。如果对于所有

（

，

），

1，则所有奇异值和对应的奇异向量都包括在近似

中如果是这样，则近似网络将与原始网络相同（受到数值误差的

影响）。设向量

是所有

的连接

。此外

，令

表示第

个卷积层

的掩蔽变量。参见图1中的一个小示例，该示例说明了如何使用掩

码变量来选择低秩近似中的奇异值和相应的

0 0 0 0 0

不

Σ Σ

0 0 0 0

U1U2

，

0 0 0

0 0 0 0 0

图1：在低秩近似中利用掩蔽变量来选择奇异值和对应的奇异向量的示

例。在该示例中

W∈

×6

，其

奇异

值分解

为

UΣ

.掩码变量

是

[1，1，0，1，0]，因此

，

4}。

∈{

，

}

（

）

，其

中

是W的秩3逼近.

我们可以以类似的方式将掩蔽变量公式应用于[30]中描述的分解回

想一下，在大多数主流深度学习框架中，卷积运算通过im2col子例程

被矩阵乘法取代[16]。将卷积计算为矩阵

）

不

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

COBLA：深度学习中的约束优化低秩近似方法

基于低秩约束和边信息的近似消息传递CS重构算法_谢中华.caj

卷积神经网络解析

解析深度学习：语音识别实践

MATLAB源码集锦-34种数据降维方法代码

非线性卷积网络的有效精确逼近

知识蒸馏到网络剪枝：神经网络模型压缩技术的进阶应用

【遗传算法在神经网络超参数调优中的应用】：原理与实战

揭秘矩阵范数与凸优化：解锁范数的优化奥秘，提升算法和建模的效率

端到端的语音识别系统设计与优化

图聚类算法性能优化秘籍：5个技巧提升效率

最新资源