收稿日期:20190915;修回日期:20191106 基金 项目:国 家留 学基金 资助 项目 (201808420418);国家 自然 科学基 金资 助项目
(61571182,61601177);湖北省自然科学基金资助项目(2019CFB530)
作者简介:熊炜(1976),男(通信作者),湖北宜昌人,副教授,硕导,博士,主要研究方向为数字图像处理和计算机视觉(xw@mail.hbut.edu.
cn);杨荻椿(1996),男,云南昭通人,硕士研究生,主要研究方向为计算机视觉和行人重识别;熊子婕(1994),女,湖北武汉人,硕士,主要研究方
向为模式识别和行人重识别;童磊(
1993),男,湖北鄂州人,硕士,主要研究方向为导航、制导与控制;李利荣(1974),女,湖北汉川人,讲师,硕导,
博士,主要研究方向为模式识别与智能系统;王娟(1983),女,河北邯郸人,讲师,硕导,博士,主要研究方向为人工智能和图像处理.
基于全局特征拼接的行人重识别算法研究
熊 炜
1,2
,杨荻椿
1
,熊子婕
1
,童 磊
1
,李利荣
1
,王 娟
1
(1.湖北工业大学 电气与电子工程学院,武汉 430068;2.美国南卡罗来纳大学 计算机科学与工程系,美国 哥
伦比亚 29201)
摘 要:针对目前行人重识别出现网络模型复杂化、识别率低的问题,提出一种基于全局特征拼接的行人重识
别算法。首先利用卷积神经网络(
CNN)提取全局特征;然后把不同卷积层提取的特征进行拼接,使特征信息互
补;最后将拼接后的特征再次进行卷积处理,获得高表征能力的特征。网络训练时,采用聚类损失函数和标签平
滑损失函数联合训练,同时 引入了随机 擦除和减小池 化 步长的训 练 技巧。在
Market1501、DukeMTMCreID、
CUHK03和 MSMT17数据集上进行了实验验证,实验表明所提算法具有良好性能,其中在 Market1501上,Rank1、
mAP分别达到了 95.9%和 94.6%。
关键词:行人重识别;全局特征拼接;聚类损失;标签平滑损失
中图分类号:TP183 文献标志码:A 文章编号:10013695(2021)01064031605
doi:10.19734/j.issn.10013695.2019.09.0578
Personreidentificationalgorithmbasedonglobalfeaturestitching
XiongWei
1,2
,YangDichun
1
,XiongZijie
1
,TongLei
1
,LiLirong
1
,WangJuan
1
(1.SchoolofElectrical&ElectronicEngineering,HubeiUniversityofTechnology,Wuhan430068,China;2.Dept.ofComputerScience&
Engineering,UniversityofSouthCarolina,ColumbiaSC29201,USA)
Abstract:Inordertosolvetheproblemsofnetworkmodelcomplexityandlowidentificationrate,thispaperproposedaperson
reidentification(ReID)methodbasedonglobalfeaturestitching.Firstly,itextractedtheglobalfeaturesusingconvolutional
neuralnetwork
(CNN).Secondly,itstitchedthefeaturesfromdifferentconvolutionlayerstogethertocomplementthefeaturein
formation.Finally,itconvolutedagaintoobtainthefeatureswithhighrepresentationability.Innetworktrainingstage,itcom
binedtheclusterlosswithlabelsmoothingloss,andadoptedrandomerasingaugmentation(REA)aswellaspoolingstepre
ductiontechniques.ItconductedextensiveexperimentstoevaluatetheperformanceofthisproposedmethodonMarket1501
,
DukeMTMCreID,CUHK03andMSMT17benchmarkdatasets.Resultsshowthattheproposedmethodoutperformsotherstate
ofthearttechniques,forinstance,theRank1andmAPonMarket1501are95.9% and94.6%,respectively.
Keywords:personreidentification(ReID);globalfeaturestitching;clusterloss;labelsmoothingloss
0 引言
行人重识别也称行人再识别(personreidentification,per
sonReID),是指在跨摄像头的环境中,判断是否存在给定行人
图像,可用于城市安防管理、智能零售、相册聚类等领域。但是
在监控视频中,经常出现行人姿态多变、拍摄角度改变、光线变
化、物体遮拦等因素引起的图像质量低劣问题。如何降低这些
因素对行人重识别的影响,是当前行人重识别研究所需要克服
的挑战。
2014年以前,研究学者通过设计鲁棒的特征提取器和优
化的相似度度量方法进行识别。文献[1]指出了利用行人步
态自身的多种特征融合识别方法,以及步态和其他生物特征融
合的识别方法。文献[2]提出了利用 Trace变换特征实例化的
识别方法。文献[3]利用行人外貌中直观和重要的颜色特征
对光照具有不变形的颜色描述符,提出了基于空间颜色特征的
描述符。文献[4]提出了基于统计稠密尺度不变特征描述行
人图像的纹理结构的特征描述子,并将度量学习和稀疏表示方
法相结合进行距离排序。文献[5]提出了基于 HSV和特征点
匹配相结合的算法。但是这些手工特征描述效果差,并且度量
学习对大数据集求解困难,难以胜任实际运用。
进入深度学习时代后,卷积神经网络(
convolutionalneural
network
,CNN)能够从大量的数据集中学习到复杂的特征,利用
简单的距离度量方法便取得了突破性的性能提升,基于深度学
习的行人重识别取代了前者。近年来,随着深度学习的发展涌
现出许多可借鉴的新颖思路。文献[
6]提出了利用姿态信息
的
spindlenet,首先提取 14个关键的人体骨架点,然后根据骨
架点提取 7个身体区域,最后将 CNN提取的原始行人图片特
征和
7个身体区域的特征融合,融合的特征作为行人特征表
征。文献[7]所提出的 PCB模型以 ResNet50作为基础网络,
将所得的特征图水平分为六块,对每块采用不同的目标损失函
数去训练,学习部分级的特征,最后将各局部特征融合描述行
人。文献[8]提出多分支网络 HACNN,一条分支用来学习全
局特征,另一条分支用来学习局部特征,其中局部特征分支又
分为 T条子分支,每条子分支学习一个局部区域的特征,最后
的行人特征表述为全局特征与局部特征的融合。上述文献的
识别效果是目前比较好的,可以发现它们都进行了特征融合来
第 38卷第 1期
2021年 1月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol38No1
Jan.2021