轻量化神经网络卷积设计：现状与趋势

需积分: 5 85 浏览量更新于2024-07-09 1 收藏 902KB PDF 举报

“轻量化神经网络卷积设计研究进展”探讨了如何解决传统神经网络在硬件资源依赖和设备性能要求上的问题，以便在算力有限的边缘设备和移动终端上实现人工智能应用，特别是计算机视觉任务。文章指出，传统神经网络由于其复杂的计算需求，往往无法在资源受限的设备上高效运行，这限制了人工智能技术的广泛应用。随着科技的进步和用户需求的增长，人工智能系统需要在便携设备上具备执行功能，如计算机视觉。因此，轻量化神经网络的研究成为了一个关键领域。文章深入研究了近年来流行的轻量化神经网络模型中的卷积设计，对比分析了不同模型中卷积结构的差异，并详述了卷积设计的核心思想和特性。作者首先定义了轻量化神经网络的概念，概述了其发展现状以及卷积设计在这些网络中面临的挑战。接着，文章将卷积设计分为三个主要类别：卷积结构轻量化、卷积模块轻量化和卷积运算轻量化。在卷积结构轻量化部分，讨论了如何简化网络架构以减少计算复杂性；卷积模块轻量化部分，研究了使用更高效的设计单元，如深度可分离卷积；卷积运算轻量化则关注如何通过量化、低精度计算等方法降低计算成本。文章引用了多个轻量化神经网络模型，如MobileNetV1、V2和V3，ShuffleNet系列，以及EfficientNet等，分析它们在卷积设计上的创新和优化，旨在为未来的研究提供指导和参考。此外，文章还提到了相关的研究项目和资助，包括北方民族大学的中央高校基本科研业务费专项、宁夏自然科学基金以及国家自然科学基金等。这篇研究论文为轻量化神经网络的卷积设计提供了深入的理解，对于优化计算效率，推动人工智能在资源受限环境中的应用具有重要意义。通过对比和分析，读者可以了解到各种轻量化策略，以及它们如何改进传统卷积神经网络的性能和效率，从而在实际应用中实现更好的计算资源利用。

马金林等：轻量化神经网络卷积设计研究进展 5

(a)Standard (b)Depthwise (c)BSConv-U (d)BSConv-S

Conv Sep.Conv

(a)标准卷积 (b)深度可分 (c)蓝图卷积-U (d)蓝图卷

分离卷积积-S

Fig.4 BSConv-U, BSConv-S and basic convolution

图 4 BSConv-U、BSConv-S 及基础卷积

“蓝图”提出可由一个蓝图卷积通过各种线性

变换迚行常规卷积替换操作，通过附加变换的微小

代价迚行模型中卷积数量的缩减，以达到轻量化效

果。BSConv-U 将常规卷积分解为一个 1×1 卷积和

二维通道卷积，与深度可分离卷积操作相反，交换

了 DW 和 PW 的顺序，先在深度方向上加权组合再

卷积。BSConv-S 基于卷积核矩阵的行与行之间存

在高度关联关系，将该卷积核迚行矩阵分解来实现

权重矩阵的低秩近似，幵通过添加正交约束来减少

参数之间的相互关联，结果是将 1 个 1×1 卷积分解

成两个 1×1 卷积。

SqueezeNet 提出的 Fire 模块同样也是解耦操

作，如图 5 所示，设计思想接近 Inception

[4, 23, 30, 31]

系列。Fire 模块将常规卷积解耦为由 Squeeze 层和

Expand 层两部分组成的分步卷积操作。Squeeze 部分

采用少于上一层特征图数量的 1×1 卷积，以减少特

征图的维数，降低计算量。使用 1×1 小尺寸卷积是

1.1 小节中的卷积核大小的调整，在此不过多赘述。

在 Expand 部分中使用 concat 操作幵联 3×3 卷积和同

样的 1×1 卷积。SqueezeNet 通过 Squeeze 层迚行降

维，在 Expand 层中将单一卷积结构拆分为幵行分支

计算，降低了模型的计算量，且在占据模型的运算

总量一定限额的卷积运算中， 1×1 卷积在卷积运算

中占比颇大。因为 3×3 卷积的参数量是 1×1 卷积的 9

倍，可降低模型运算量。最终 SqueezeNet 的模型参

数量仅占等性能 AlexNet 的 2.14%。

Fig.5 Fire module

图 5 Fire 模块

蓝图卷积的解耦依据卷积内核的内部相关性，

通过定量分析得出深度方面的相关性更加优势的

信息，从而决定解耦后分段卷积的执行顺序。

SqueezeNet 的卷积解耦设计则是借鉴了 MobileNets

的深度可分离卷积和 Inception 的多尺度思想。借鉴

深度可分离卷积，使得卷积操作在空间与通道上迚

行分离，导致 Fire 模块拆解为 Squeeze 和 Expand

两部分。借鉴由大小不同卷积构成的 Inception 初始

模块的思想，在 Expand 部分中选取模型设计常用

的 1×1 卷积和 3×3 卷积迚行组合。

与标准三维卷积的区别在于，蓝图卷积将卷积

拆解为由二维卷积与权重向量构成的组合卷积结

构，使用分段计算后合幵的方式，改善了卷积单纯

的乘积运算，达到了轻量化的目的。SqueezeNet 则

剩余20页未读，继续阅读

syp_net

粉丝: 158

轻量化神经网络卷积设计：现状与趋势

轻量化神经网络卷积设计研究进展.docx

轻量化卷积神经网络目标检测算法综述.pdf

深度解析：轻量化神经网络卷积设计研究与应用进展

卷积神经网络及其研究进展.pdf

基于深度卷积神经网络的目标检测技术的研究进展.pdf

卷积神经网络在木材缺陷检测应用中的研究进展.pdf

卷积神经网络研究综述.pdf

移动设备上的轻量级神经网络：设计与优化

深度学习驱动的卷积神经网络最新进展：数据增长与性能飞跃

深度学习与卷积神经网络在目标检测中的进展分析

最新资源