Keras实现高效轻量级网络ShuffleNet：提升移动设备性能

49 浏览量更新于2024-08-30 2 收藏 179KB PDF 举报

本教程旨在通过Keras实现轻量级网络ShuffleNet，这是一种由旷视（DAMO Academy）提出并优化的高效CNN架构。ShuffleNet的设计目标是针对计算资源极其有限的移动设备，如10-150 MFLOPs，它采用了一种创新的方法，即结合组卷积和信道混洗，以提升模型的计算效率同时保持较高的精度。首先，组卷积是一种早期在AlexNet中使用的技术，但当时主要受限于GPU显存容量。组卷积的基本原理是将输入特征图按通道分割成多个小块，每个块独立进行卷积，最后再合并输出。虽然现在许多深度学习框架如Keras支持组卷积，但在TensorFlow中，由于其不内置该功能，用户需要自行编写，这可能会影响效率。组卷积层的实现代码应遵循这一原则。 ShuffleNet的核心优势在于它能够在40 MFLOPs的计算预算下超越其他轻量级模型，例如在ImageNet分类任务上，它的top-1错误率相比最新的MobileNet更低，证明了其在性能上的优越性。在实际应用中，比如在基于ARM的移动设备上，ShuffleNet的速度比AlexNet快出13倍，同时保持着相对良好的准确性。 GitHub上提供了ShuffleNet-Keras的开源实现，这对于那些想要利用Keras构建高效轻量级网络的开发者来说是一个宝贵的资源。通过这个教程，读者可以学习如何在Keras中集成ShuffleNet架构，并理解其中的关键组件，如如何设置组卷积层的参数以及如何在实际项目中应用这些技术。本教程涵盖了以下几个关键知识点： 1. ShuffleNet的背景和目标：设计用于移动设备的高效轻量级网络。 2. 组卷积和信道混洗技术：提高计算效率的新型运算方法。 3. Keras实现细节：如何在Keras中使用组卷积层。 4. 实际应用案例：ShuffleNet在ImageNet和MS COCO任务中的表现及与AlexNet的比较。 5. 开源资源：ShuffleNet-Keras的GitHub链接，便于学习和实践。通过学习并实践这一教程，开发人员将能更好地理解和运用ShuffleNet在计算资源有限的场景中所带来的优势。

keras 实现轻量级网络实现轻量级网络ShuffleNet教程教程

ShuffleNet是由旷世发表的一个计算效率极高的CNN架构，它是专门为计算能力非常有限的移动设备(例如，10-150 MFLOPs)

而设计的。该结构利用组卷积和信道混洗两种新的运算方法，在保证计算精度的同时，大大降低了计算成本。ImageNet分类

和MS COCO对象检测实验表明，在40 MFLOPs的计算预算下，ShuffleNet的性能优于其他结构，例如，在ImageNet分类任

务上，ShuffleNet的top-1 error 7.8%比最近的MobileNet低。在基于arm的移动设备上，ShuffleNet比AlexNet实际加速了13

倍，同时保持了相当的准确性。

Paper：ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile

Github：https://github.com/zjn-ai/ShuffleNet-keras

网络架构网络架构

组卷积组卷积

组卷积其实早在AlexNet中就用过了，当时因为GPU的显存不足因而利用组卷积分配到两个GPU上训练。简单来讲，组卷积就

是将输入特征图按照通道方向均分成多个大小一致的特征图，如下图所示左面是输入特征图右面是均分后的特征图，然后对得

到的每一个特征图进行正常的卷积操作，最后将输出特征图按照通道方向拼接起来就可以了。

目前很多框架都支持组卷积，但是tensorflow真的不知道在想什么，到现在还是不支持组卷积，只能自己写，因此效率肯定不

及其他框架原生支持的方法。组卷积层的代码编写思路就与上面所说的原理完全一致，代码如下。

def _group_conv(x, filters, kernel, stride, groups):

"""

Group convolution

# Arguments

x: Tensor, input tensor of with `channels_last` or 'channels_first' data format

filters: Integer, number of output channels

kernel: An integer or tuple/list of 2 integers, specifying the

width and height of the 2D convolution window.

strides: An integer or tuple/list of 2 integers,

specifying the strides of the convolution along the width and height.

Can be a single integer to specify the same value for

all spatial dimensions.

groups: Integer, number of groups per channel

# Returns

Output tensor

"""

channel_axis = 1 if K.image_data_format() == 'channels_first' else -1

in_channels = K.int_shape(x)[channel_axis]

# number of input channels per group

nb_ig = in_channels // groups

# number of output channels per group

nb_og = filters // groups

gc_list = [] # Determine whether the number of filters is divisible by the number of groups

assert filters % groups == 0

for i in range(groups):

if channel_axis == -1:

x_group = Lambda(lambda z: z[:, :, :, i * nb_ig: (i + 1) * nb_ig])(x)

else:

x_group = Lambda(lambda z: z[:, i * nb_ig: (i + 1) * nb_ig, :, :])(x)

下载后可阅读完整内容，剩余5页未读，立即下载

weixin_38674223

粉丝: 3
资源: 951

Keras实现高效轻量级网络ShuffleNet：提升移动设备性能

count-mAP-txt-master_keras_轻量级网络_shufflenet_

神经网络ShuffleNet：移

轻量级注意力机制代码

基于Keras实现手写数字识别的神经网络及框架通常用哪些

keras是如何实现卷积神经网络

keras实现神经网络gpu并行训练

基于keras实现分类的研究背景与意义

keras实现矩阵转置

基于keras实现的声纹识别预训练模型

keras 输出网络结构_TextCNN 模型完全解读及 Keras 实现

最新资源