移动设备上的轻量级神经网络：设计与优化

需积分: 9 114 浏览量更新于2024-07-16 1 收藏 944KB PDF 举报

“轻量级神经网络架构综述” 在当前的智能时代，深度神经网络（Deep Neural Networks, DNNs）已经成为解决复杂问题的核心技术，广泛应用于图像识别、自然语言处理等多个领域。随着移动互联网的飞速发展，智能手机、可穿戴设备等便携式设备的普及，用户对设备的计算性能和功耗有了更高的要求。轻量级神经网络（Lightweight Neural Networks）应运而生，旨在在保证模型性能的同时，降低计算复杂度和内存需求，以适应有限计算资源的设备。本文主要从三个方面探讨了构建轻量级神经网络的方法： 1. **人工设计轻量级神经网络**：这种方法主要依赖于专家经验和直觉，通过设计特殊的网络结构，如MobileNet、 ShuffleNet等，采用深度可分离卷积、通道shuffle等技术，减少计算量和参数数量，提高计算效率。 2. **神经网络模型压缩**：包括权重量化、剪枝、知识蒸馏等技术。权重量化将浮点数权重转换为低精度表示，如二值化或权值共享，以减少存储和计算需求。剪枝通过去除不重要的连接或层来精简模型。知识蒸馏则是将大型教师模型的知识传递给小型学生模型，使学生模型在保持性能的同时变得更小。 3. **基于神经网络架构搜索的自动化设计**：利用自动化工具，如AutoML，通过搜索空间中的不同架构组合，找到性能与效率的最佳平衡点，如NASNet、AmoebaNet等。这种方法减少了人工设计的负担，但计算资源消耗较大。文章还对每种方法的特点进行了总结和分析，指出人工设计方法依赖于专家经验，可能无法达到最优；模型压缩技术适用于已有的网络，但可能会牺牲一些性能；自动化设计能探索大量可能的架构，但搜索过程复杂且耗时。典型算法如MobileNet系列在移动设备上表现出色，其深度可分离卷积显著减少了计算量。另外，知识蒸馏方法如Hinton等人提出的Distillation，成功地将大模型的“智慧”传授给了轻量级模型。神经网络架构搜索（Neural Architecture Search, NAS）领域的进展，如enas、DARTS等，通过优化算法寻找最优网络结构，进一步推动了轻量级网络的设计。最后，文章对未来发展趋势进行了展望，包括更高效的搜索策略、更精细的模型优化技术、以及跨模态轻量级网络的研究等，这些都将推动轻量级神经网络在资源受限环境中的应用更上一层楼。关键词：轻量级神经网络，便携式设备，神经网络模型压缩，神经网络架构搜索，自动机器学习

减少特征通道数,使得深度卷积(Depthwise Convolution)层工作在高维的特征之中,与之前的残差分支正好相

反.其次,激活函数在高维的空间中能够有效的增加非线性能力,但是在低维空间中会破坏特征的表达能力,因

为第二个逐点卷积(Pointwise Convolution)起到降维的作用,所以去掉第二个逐点卷积(Pointwise Convolution)

之后的激活层,也就是使用了线性的 Bottleneck,如图 6 所示.由于提升了网络的表达能力,MobileNet V2

[10]

只需

要 MobileNet V1

[8]

的

2 / 5

的计算量就能达到相同的性能.

图 6 (a)为正常的 Residual Block,残差分支通道数小于主分支通道数,(b)为反残差结构(Inverted residual

block),残差分支通道数大于主分支通道数.

后来,Ma

[12]

等人发现,FLOPs 作为一个间接的指标,只能大致地估测运行速度,与速度并不完全相符.主要

原因有两方面,一是很多操作无法被算入 FLOPs 中,例如内存访问成本(Memory Access Cost, MAC)、并行化

程度等；二是受到计算平台的影响.Ma

[12]

等人提出了四种轻量级网络的指导方案:1、相同的输入输出通道数

能够减少内存访问成本(MAC)；2、过多的分组卷积(Group Convolution)会增加 MAC；3、网络的碎片化程

度会减少并行化程度；4、不能忽略元素级操作.

根据以上四条方案,在 ShuffleNet V1

[9]

的基础上进行改进,如图 7 所示:

BN ReLUBN ReLU

Add

ReLU

11 GConv

Channel Shuffle

33 DWConv

(a)

11 GConv

11 Conv

BN ReLU

Channel Shuffle

BN ReLU

11 Conv

33 DWConv

Concat

Channel Split

(c)

11 GConv

33 DWConv

(stride=2)

Channel Shuffle

Concat

33 DWConv

(stride=2)

11 GConv

BN ReLU

(d)

BN ReLU

(b)

Concat

ReLU

11 GConv

Channel Shuffle

33 DWConv

(stride=2)

33 AVGPool

(stride=2)

图 7 (a)(b)分别为空间尺度不变的 ShuffleNet V1 Unit和空间尺度变小的 ShuffleNet V1 Unit,(c)(d)分别为空间

尺度不变的 ShuffleNet V2 Unit 和空间尺度变小的 ShuffleNet V2 Unit

(a)(b)为原始的 ShuffleNet V1

[9]

Unit,(c)(d)为改进后的 ShuffleNet V2

[12]

Unit.(c)利用通道分割(Channel

Split)的方法,将输入分割成两部分,一半作为直接连接分支,一半作为残差分支,并且残差分支中1 ∗ 1卷积的

输入输出通道数相等(符合方案 1),并且不使用分组卷积(Group Convolution)(符合方案 2).最后进行 Concat,避

免了特征相加的操作(符合方案 4).(d)去掉了通道分割(Channel Split)操作,从而在减少了特征图的空间尺寸同

时,通过 Concat 增加了通道数.ShuffleNet V2 通过提出新的指标(MAC),并且在 MAC 上优化,加快了运行速度

同时也提升了准确率.新的 ShuffleNet V2比 MobileNet V1 快 58%,比 ShuffleNet V1快 63%,比 Xception 快 25%.

在 Zhang 提出的 IGCNets

[20]

中同样的利用到了分组卷积(Group Convolution),深度卷积(Depthwise

(b)

(a)

剩余26页未读，继续阅读

syp_net

粉丝: 158
资源: 1187

移动设备上的轻量级神经网络：设计与优化

轻量级卷积神经网络汇总

轻量化神经网络篇（SqueezeNet、Xception、MobileNet、ShuffleNet）

read-paper-list:图像分割-目标检测-轻量级网络

轻量级神经网络的结构详细讲解

轻量化网络综述

卷积神经网络研究综述_李彦冬1

卷积神经网络研究综述_李炳臻1

卷积神经网络研究综述 (1).pdf

卷积神经网络综述.pdf

深度神经网络模型压缩综述

最新资源