收稿日期:20180719;修回日期:20180914 基金项目:国家自然科学基金重点资助项目;海军装备预研创新项目
作者简介:李亚辉(1992),男,河南周口人,硕士研究生,主要研究方向为信息融合、目标识别、网络压缩(yahuiliem@163.com);刘俊(1971),
男,教授,博士,主要研究方向为信息融合、模式识别、智能系统.
基于轻量级深度网络的目标识别方法
李亚辉,刘 俊
(杭州电子科技大学 通信与传输信息融合国防重点学科实验室,杭州 310018)
摘 要:针对资源受限条件下目标识别任务,提出了一种基于轻量化深度网络的目标识别方法。通过优化卷积
操作、模型参数压缩、增强特征表达深度等网络结构的优化方法,设计并实现了针对嵌入式平台应用的轻量化网
络模型结构,使得深度网络模型在保证精度的条件下,模型参数和运行所需资源的大幅缩减。实验表明,提出的
轻量化深度模型较 ILSVRC15冠军提出的基础模型 ResNet,在 ImageNet67数据集上,网络模型压缩为基础模型
10.2%的条件下仍保持 93.5%的目标识别准确率。
关键词:深度学习;目标识别;轻量化;嵌入式应用
中图分类号:TP183 文献标志码:A 文章编号:10013695(2020)03062091905
doi:10.19734/j.issn.10013695.2018.07.0663
Objectrecognitionmethodbasedonlightweightdepthnetwork
LiYahui,LiuJun
(LaboratoryofFundamentalScienceonCommunicationInformationTransmission& FusionTechnology,HangzhouDianziUniversity,Hang
zhou310018,China)
Abstract:Aimingatthetaskofobjectrecognitionunderresourceconstrainedcondition,thispaperproposedamethodofob
jectrecognitionbasedonlightweightdepthnetwork.Byoptimizingthedesignmethodofthenetworkstructuresuchasconvolu
tionoperation,modelparametercompressionandenhancementoffeatureexpressiondepth,thispaperdesignedandimplemen
tedthelightweightnetworkmodelstructurenamedSeDResNetforembeddedplatform.Sothatthedepthnetworkmodelcould
reducetheparametersofthemodelandtheresourcesneededforoperationundertheconditionofguaranteeingtheprecision.
TheexperimentalresultsshowthatthelightweightdepthmodelhasbetterperformancethanthatofthebasicmodelResNetpro
posedbyILSVRC15champion
,anditcanachievethemodelaccuracyof93.5% undertheconditionthatthemodelwith
102% fewerparametersonImageNet67dataset.
Keywords:deeplearning;objectdetection;lightweight;embeddedapplication
0 引言
军事领 域 中 自 动 目 标 识 别 (automatictargetrecognition,
ATR)作为战场环境感知领域的重要环节,是一种利用各种传
感器从客观世界获取目标 /背景信号,并使用计算机信息处理
方法自动地分析场景信号、检测、识别感兴趣的目标及获取目
标各种定性、定量性质的军事目标识别方法。作为光谱信息领
域关键技术的图像目标类别检测技术,其通过从原始的图像中
提取目标的特征并以此为基础完成目标的识别任务,也是计算
机视觉中低层视觉处理的关键问题。图像目标类别检测技术
又称类别级目标检测或目标检测,旨在利用图像处理与模式识
别等领域的理论和方法,检测出图像中存在的目标对象,确定
这些目标对象的语义类别,并使用边界框标定出目标对象在图
像中的位置
[1]
。图像 目 标 类 别 检 测 是 目 标 分 类 的 一 个 子 问
题,目标分类可以分为三个层级:图像级,即确定图像中是否有
相关的目标对象,如图像分类、图像注释技术;区域级,即确定
图像中某个区域是否含有某个类别,即本文所述的图像目标类
别检测;像素级,即确定图像中各个像素归属于哪类目标对象。
像素级也可以细分为类别级目标分割和语义分割两类。在此,
本文只关注在第一层级,也即是图像级目标识别任务的研究。
随着物联网、大数据的飞速发展,智能终端设备(
intelligent
ofterminal,IoT)在人们的生活中发挥着越来越重要的作用,同
时也为智能感知、万物互联的智能化时代迎来了新的契机,为
硬件资源、数据量强依赖的深度学习方法提供了基础支撑。由
于深度学习强大的特征提取和表达能力,使其在目标检测、语
音识别、自然语言处理等领域中发挥着越来越重要的作用。传
统的计算机视觉任务通常采用特定领域专家设计的针对特定
目标类别的特征,其过程具有特征设计的复杂性和低效性,难
以在其他领域中较好的使用。而深度学习采用在权值迭代更
新过程中实现对图像空间域信息的提取和表达,从而能够自动
提取出目标特征,省去了传统目标识别算法所使用的特征需要
领域专家针对特定类别进行抽象特征设计的繁杂工作。特别
是迁移学习的出现使得计算机视觉任务的设计者可以不过度
关注特征结构设计这一繁杂过程,这也使得深度网络可以实现
在不同领域之间的快速迁移,而不需要重新设计网络模型结
构。然而深度学习算法的使用也对硬件计算能力和样本数据
数量和质量提出了更高的要求。由于深度网络模型内部庞大
的参数量和多级的非线性映射,使得模型具有良好的特征提取
和表达能力。此外,由于特征提取过程采用基于样本集的迭代
学习过程来完成,所以该过程需要满足硬件计算能力和样本集
的体量两大要求。而这两者也正是深度学习在大数据时代能
够再次复苏的两个重要因素。
经典网络模型中由于存在大量的可学习参数,使得模型需
要大量的样本数据,从而保证网络模型具有较好的泛化能力。
但由于其密集的计算和存储使得模型的应用范围受到了严重
的制约,使得其较多地应用在服务器等高性能集群上。然而令
人欣喜的是世界各地的研究者在近几年的研究中发现,深度网
第 37卷第 3期
2020年 3月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol37No3
Mar.2020