没有合适的资源?快使用搜索试试~ 我知道了~
首页自适应角度损失函数在深度人脸识别中的应用
"基于自适应角度损失函数的深度人脸识别算法研究" 本文主要探讨了一种针对人脸识别的创新性深度学习算法,旨在解决传统角度空间损失函数存在的问题,如手动调节超参数引起的训练不稳定性以及不同类别数量导致的算法移植性差。提出的自适应角度空间损失函数采用了下界判断机制,提高了模型的稳定性和可移植性。 首先,传统的角度空间损失函数在训练过程中通常需要人工设定超参数,这可能导致训练过程的不稳定性。为了解决这个问题,该研究提出了一种新的自适应角度空间损失函数。这个函数基于假设人脸表达特征分布在超球体空间的基础上,通过分析不同超参数对训练结果的影响,寻找使得预测概率公式二阶导数为零的最佳状态。这一策略可以动态地计算mini-batch中角度分布的去尾平均数,从而避免手动调整超参数,提升了算法训练的稳定性。 其次,为了增强算法的可移植性,研究者引入了类别中心的最小期望后验概率,以此作为自适应调节超参数的下界。这种方法考虑了不同类别数量的影响,确保了算法在面对不同数据集时能够保持良好的性能。 实验部分,新算法在两个大型人脸识别数据集——LFW(Labeled Faces in the Wild)和MegaFace百万级人脸数据集上进行了评估。结果显示,新方法显著提高了人脸识别的精度和模型的收敛速度。此外,通过在亚洲人脸数据集上的测试,进一步证明了该方法在应对面部差异时的鲁棒性和移植性。 这项研究为深度人脸识别提供了一个更优化的损失函数设计,它能自适应地调整参数,降低对人工干预的依赖,同时增强了算法在不同应用场景下的适应性。这一贡献对于未来的人脸识别技术发展具有重要的理论和实践意义。
资源详情
资源推荐
收稿日期:20190608;修回日期:20190730 基金项目:国家自然科学基金资助项目(61673277)
作者简介:姬东飞(1995),男,辽宁沈阳人,硕士,主要研究方向为深度学习目标检测以及图像处理(648513181@qq.com);丁学明(1971),
男,安徽无为人,副教授,博士,主要研究方向为智能控制、系统辨识以及嵌入式系统.
基于自适应角度损失函数的深度人脸识别算法研究
姬东飞,丁学明
(上海理工大学 光电信息与计算机工程学院,上海 200093)
摘 要:角度空间损失函数往往因需要手动调节超参数而引起算法训练的不稳定,类别标签数量的不同也将导
致算法的移植性较差。针对这些问题,提出一种带有下界判断的自适应角度空间损失函数并应用于人脸识别。
该方法以假设人脸表达特征分布在超球体空间为切入点,通过分析不同超参数对训练结果的影响,使预测概率
公式的二阶导数为零并动态地计算当前 minibatch角度分布的去尾平均数;为了提高算法的可移植性,根据类
别中心的最小期望后验概率给出自适应调节超参数的下界。通过在 LFW 和 MegaFace百万级人脸数据集上进
行算法评估,证明提出的方法可以有效地提高人脸识别精度以及模型收敛率,在亚洲人脸数据集上的实验证明
该方法具有较好的鲁棒性与移植性。
关键词:人脸识别;角度空间;损失函数;自适应调节;算法移植性
中图分类号:TP391.41 文献标志码:A 文章编号:10013695(2020)10059316906
doi:10.19734/j.issn.10013695.2019.06.0250
Researchondeepfacerecognitionbasedonadaptiveanglelossfunction
JiDongfei,DingXueming
(SchoolofOpticalElectrical&ComputerEngineering,UniversityofShanghaiforScience&Technology,Shanghai200093,China)
Abstract:Anglespacelossfunctionisoftenunstablebecauseofitneedstomanuallyadjustthehyperparameters.Thenumber
ofcategorylabelsleadtopoorportabilityofthealgorithm.Tosolvetheseproblems,thispaperproposedanadaptiveanglespace
lossfunctionwithlowerboundjudgmentandappliedittofacerecognition.Basedonthehypothesisthatthefacialexpression
featuresweredistributedinhyperspherespace,itmadethesecondderivativeofthepredictionprobabilityformulazerobyana
lyzingtheinfluenceofdifferenthyperparametersonthetrainingresults.Then,itcalculatedthetailedmedianangleofthecur
rentminibatch.Inordertoimprovetheportabilityofthealgorithm,itinferredthelowerboundofadaptivehyperparameterby
theminimumexpectedposteriorprobabilityoftheclasscenter.ByevaluatingthealgorithmonLFW andMegaFacedatasets,the
proposedmethodcaneffectivelyimprovetheaccuracyoffacerecognitionandtheconvergencerateofthemodel.Experiments
onAsianCelebdatasetshowthattheproposedmethodhasbetterportability.
Keywords:facerecognition;anglespace;lossfunction;adaptiveadjustment;algorithmicportability
0 引言
深度人脸识别是一种基于深度学习的人脸表征方法。近
年来,深度卷积神经网络显著提高了人脸比对(一对一)以及
多人脸 ID辨识(一对多)的识别效果
[1]
。DCNN在人脸识别中
取得优异的效果主要归功于以下因素:大量的训练数据、复杂
的深度神经网络结构以及高效的损失函数。目前,大量的人脸
数据如
LFW
[2]
、CASIAWebFace
[3]
、MegaFace
[4]
等数据集都包
含了可以被用来训练神经网络的图片,并且大量基于数据增强
的研究算法如随机裁剪
[5]
应运而出。与此同时,大量研究如
DeepFace
[6]
、DeepID3
[7]
、VGGFace
[8]
和 FaceNet
[9]
都证明了改
进神经网络结构同样可以提高人脸识别精度。但是数据增强
和改进网络结构的方法不能满足持续提高识别精度的要求,相
关研究人员慢慢地将视线转移到改进神经网络损失函数这一
层面。目前大多数深度学习网络均采用 softmax层与交叉熵损
失函数结合的形式进行训练,下文简称 softmax损失函数。为
了获得更具鉴别力的人脸特征,人脸表达特征应满足最大化类
间距离、最小化类内距离的要求。文献[10]提出一种中心损
失函数来训练神经网络实现了最小化类内方差,但是却忽略了
类间方差,导致模型给出的只是一种次优解;文献[11~14]采
用对比损失函数以及三元损失函数来改进
softmax损失函数显
著提高了识别精度,但是这些方法往往依赖于大量繁琐的数据
预处理才能获得较好的表现。以上损失函数均基于欧氏空间
进行学习。
SphereFace
[15]
提出角度空间损失函数并引入乘法角度间
隔 m,指出角度空间与 softmax层更具有一致性,因为欧氏空间
度量的实质就是角度空间度量,如二分类神经网络
softmax层
无偏置输出为 y=wx=
‖
w
‖‖
x
‖
cos
θ
1,2
,对权重矩阵 W 的学
习可以理解为对角度
θ
的学习。假设神经网络 softmax层权重
矩阵 W 的列向量代表角度空间中各个类别的中心,则可以通
过引入乘法角度间隔 m来最大化类间距离、最小化类内距离。
但是引入的超参数使损失函数不再单调且无法反向传播,需要
增加额外的模块进行近似处理,这就引入了大量的人为误差导
致训练不稳定。
CosFace
[16,17]
引入 cosine空间损失函数并提出
cosine间隔 m正则项,获得了更好的识别精度,但是将正则项
与原 softmax损失函数一起优化将会导致神经网络更倾向于优
化原 softmax损 失函数,从 而 忽 略 掉 那 些 较 难 训 练 的 样 本。
ArcFace
[18]
引入一个 arccos模块,将权重 W 和表达特征 x的余
弦相似度
cos
θ
转换至角度空间
θ
,并直接在角度空间对
θ
本
身引入一个间隔 m,最后重扫描至欧氏空间进行训练获得了里
程碑式的识别精度。然而超参数的选取仍然需要人为来进行
第 37卷第 10期
2020年 10月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol37No10
Oct.2020
下载后可阅读完整内容,剩余5页未读,立即下载
weixin_38699492
- 粉丝: 8
- 资源: 946
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- OptiX传输试题与SDH基础知识
- C++Builder函数详解与应用
- Linux shell (bash) 文件与字符串比较运算符详解
- Adam Gawne-Cain解读英文版WKT格式与常见投影标准
- dos命令详解:基础操作与网络测试必备
- Windows 蓝屏代码解析与处理指南
- PSoC CY8C24533在电动自行车控制器设计中的应用
- PHP整合FCKeditor网页编辑器教程
- Java Swing计算器源码示例:初学者入门教程
- Eclipse平台上的可视化开发:使用VEP与SWT
- 软件工程CASE工具实践指南
- AIX LVM详解:网络存储架构与管理
- 递归算法解析:文件系统、XML与树图
- 使用Struts2与MySQL构建Web登录验证教程
- PHP5 CLI模式:用PHP编写Shell脚本教程
- MyBatis与Spring完美整合:1.0.0-RC3详解
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功