没有合适的资源?快使用搜索试试~ 我知道了~
首页中文翻译 SphereFace Deep Hypersphere Embedding for Face Recognition
中文翻译 SphereFace Deep Hypersphere Embedding for Face Recognition
需积分: 50 392 浏览量
更新于2023-03-16
评论
收藏 2.74MB PDF 举报
论文翻译,保留原文排版。 SphereFace: Deep Hypersphere Embedding for Face Recognition
资源详情
资源评论
资源推荐

第 1 页 共 24 页
目录
摘要 ................................................................................................................... 2
1 介绍 ............................................................................................................. 2
2 相关工作 ..................................................................................................... 5
3 深度超球面嵌入 .......................................................................................... 6
3.1 Softmax loss 回顾 ............................................................................................................6
3.2 Softmax 损失的角度裕量介绍 ........................................................................................7
3.3 A-Softmax loss 的超球面解释 .........................................................................................9
3.4 A-Softmax 损失属性 ................................................................................. 10
3.5 讨论 .............................................................................................................................. 11
4 实验(详情见附录) .................................................................................. 11
4.1 实验设置 ....................................................................................................................... 11
4.2 探索性实验 ................................................................................................................... 13
4.3 在 LFW 和 YTF 上的实验 ............................................................................................ 14
4.4 在 MegaFace Challenge 上的实验 ................................................................................ 16
5 结语 ........................................................................................................... 17
参考文献 ......................................................................................................... 18
附录 ................................................................................................................. 21

第 2 页 共 24 页
摘要
本文讨论了开放协议下的深层人脸识别(FR)问题:理想人脸特征预期在适当选择
的尺度空间下具有“类内最大距离”小于“类间最小距离”的特性。 然而,现存的算法
中几乎没有能够有效实现这个要求的。 为此,我们提出角度 Softmax(A-Softmax)损
失,使卷积神经网络(CNN)能够学习角度判别特征。 在几何上,A-Softmax 损失可以
被看作是一个在超球面流形上令人印象深刻的区分性约束,其本质上是与预先映射到超
球面上的人脸进行匹配。 而且,角边界的大小可以通过参数 m 来定量地调整。 我们进
一步推导出具体的 m 来近似理想的特征标准。在 LFW、Youtube FACE(YTF)、MegaFace
Challenge 上的实验结果,表明了 A-Softmax loss 在人脸识别(RF)任务的优越性。本文
代码已经公开。
1 介绍
近几年我们见证了卷积神经网络(CNN)在人脸识别(FR)上的巨大成功。深度卷
积神经网络推极大的推进了 FR 的性能,其性能达到了前所未有的高度,这一切归功于
先进的网络结构和区别性(discriminative)学习方法。通常,人脸识别可以分为两类:
人脸辨别和人脸验证,前者将一张人脸分类为某个指定的身份,而后者判断一对人脸是
否有相同的身份(是否是同一个人)。
在测试协议条款中,人脸识别算法可以在闭集或开集下进行评估,两种评估方法如
图 1 所示。

第 3 页 共 24 页
图 1 开放式和封闭式人脸识别的比较。
在测试协议条款中,人脸识别算法可以在闭集或开集下进行评估,两种评估方法如
图 1 所示。对于闭集协议,要求所有的测试身份都预先定义在训练集里。分类测试的人
脸图像到给定的身份是很自然的。在这个设想下,人脸验证时等价于分别对一对人脸进
行识别(见图 1 左边)。因此,闭集 FR 可以作为一个分类问题很好的处理,这里希望这
些特征时可分离的。对于开集协议,待测试的身份通常与训练集没有共同元素(disjoint),
这使 FR 更有挑战性,但更接近实际情况。因为不可能将人脸分类到训练集中已知的身
份,所以我们需要将人脸映射到可区分的特征空间中。在这个设想下,人脸识别可以看
作是在待测(probe)人脸和图库中每个身份之间的人脸验证(看图 1 右边)。Open-set
FR 本质上是一个度量学习(metric learning)问题,其中关键是学习到可区分的大裕度

第 4 页 共 24 页
特征(large-margin features)。
期望的开集 FR 特征预计满足这个准则:在某个尺度空间下,最大类内距离比最小
类间距离要小。如果我们想要利用最近邻达到完美的准确度度,这个准则是必须要满足
的。然而,在人脸库(face s exhibit)中,大类内变异,高类间相似性,使得要学习到满
足该准则的特征通常是困难的。
很少有基于 CNN 的方法能定制一个有效的表示上述标准的损失函数。通过 softmax
损失学习人脸特征是开拓性的工作,但是 Softmax 损失只能学习可分离的特征,这样的
特征可区分度还是不够高。为了解决这个问题,一些方法为了增强特征的可区分性,将
Softmax 损失、对比损失(contrastive loss)和中心损失(center loss)结合起来。采用三
元组损失(triplet loss)来监督嵌入学习(embedding learning),达到了最先进的人脸识
别效果。然而,中心损失只会明显激励类内紧凑。对比损失或三重损失都不能完全约束
每个单独的样本,因此需要仔细设计 pair 或 triplet 损失的 mining 程序,设计过程不仅
耗时而且性能敏感。
利用欧几里得边缘(Euclidean margin)去学习特征似乎是公认的选择,但是一个问
题出现了:欧几里得边缘总是适合学习辨别性的人脸特征吗?为了回答这个问题,我们
首先研究了欧式边际损失(Euclidean margin based losses)如何应用于人脸识别。
目前大多数方法是将欧式边际损失与 Softmax 损失结合,以构建联合监督。然而,
如图 2 观察到的,通过 Softmax 损失学习的特征存在固有的角度分布(这也被论文[34]
证实了)。从某种意义上说,欧式边际损失与 Softmax 损失互不相容,所以将这两种类型
的损失结合起来的动机不大。在本论文中,我们建议整合角度余量(margin)。我们以一
个二分类(binary-class)例子来分析 Softmax 损失。Softmax 损失确定的边界是
,其中 Wi 和 bi 分别是 Softmax 损失的权重和偏置。如果我们定义
x 为特征向量并令
,b1=b2=0,这个确定的边界就变成了
,这里
是在 Wi 和 x 的夹角。新的决策边界仅取决于θ1 和θ2。 修改后
的 Softmax 损失能够直接优化角度,使得 CNN 能够学习角度分散特征(distributed)(图
2)。
与原来的 Softmax 损失相比,修改后的 Softmax 损失所学到的特征是角度分布的,
但不一定更具有区分性。最后,我们将修改后的 Softmax 损失推广到角度 Softmax(A-
Softmax)损失。具体来说,我们引入一个整数 m ( m≥1 )来定量控制决策边界。 在二
元类情况下,类 1 和类 2 的判定边界分别变为
和
。m 定量控制角边缘的大小。 此外,A-Softmax 损失可以很容易地推广到
多个类别,类似于 Softmax 损失。 通过优化 A-Softmax 损失,决策区域变得更加分离,
同时扩大了类间边界并压缩了类内角度分布。
A-Softmax 损失具有明确的几何解释。 通过 A-Softmax 损失监督,学习的特征构造
了一个等同于超球面流形上测地距离的鉴别角距离度量。A-Softmax 损失可以被解释为

第 5 页 共 24 页
将学习特征约束为在超球面流形上具有区别性,其本质上匹配之前面部图像位于流形
[14, 5, 31]。A-Softmax 损失和超球面流形之间的紧密联系使学习功能更有效地用于人脸
识别。出于这个原因,我们将学习的特征称为 SphereFace。
此外,A-Softmax 损失可以通过参数 m 定量调整角边界,使我们能够进行定量分析。
鉴于此,我们推导参数 m 的下界以近似所需的开放式 FR 准则,即最大的类内距离应该
小于最小的类间距离。
我们的主要贡献可概括如下:
(1) 我们提出 CNNs 的 A-Softmax 损失,以清晰和新颖的几何解释来学习区分性人
脸特征。学习的特征有区别地跨越在超球面流形上,其本质上匹配先前的面也位于流形
上。
(2) 我们推导出 m 的下界,使得 A-Softmax 损失可以近似于最小类间距离大于最大
类内距离的学习任务。
(3) 我们是第一个显示 FR 角边界的有效性的人。 在公开的 CASIA 数据集上训练
[37],SphereFace 在几项基准测试中取得了具有竞争力的结果,其中包括 Labeled Face in
the Wild(LFW), Youtube Faces(YTF)和 MegaFace Challenge 1。
2 相关工作
度量学习。度量学习旨在学习相似性(距离)函数。传统的度量学习通常根据给定
的特征
,
来学习距离度量
的矩阵 A。最近,普
遍的深度度量学习[7,17,24,30,25,22,34]通常使用神经网络来自动学习识别特征
,
,
然后是简单的距离度量,例如欧几里得距离
。深度量度学习中最广泛使用的
损失函数是对比损失[1,3]和三元组损失[32,22,6],并且都将欧几里德边缘强加给特征。
深度人脸识别。深度人脸识别。可以说是过去几年中最活跃的研究领域之一。 论
文[30,26]使用由 Softmax 损失监督的 CNN 来处理开放集合 FR,这基本上将开放集合 FR
视为多类分类问题。 [25]结合对比损失和 Softmax 损失共同监督 CNN 训练,大大提高
了表现。 [22]使用三重损失来学习统一的人脸嵌入。使用近 2 亿张脸部图像训练,他 们
实现了当前最先进的 FR 精确度。受线性判别分析的启发,[34]提出 CNN 的中心损失,
并且也获得了有希望的表现。总的来说,当前表现良好的 CNN [28,15]主要建立在对比
损失或三重损失上。人们可以注意到,最先进的 FR 方法通常采用来自度量学习的想法
(例如对比损失,三重损失),这表明了区分性度量学习可以很好的处理开集 FR 问题。
通过区分性量学习来解决.L-Softmax 损失[16]也隐含地涉及角度的概念。作为一种正
则化方法,它显示出对闭集分类问题的巨大改进。不同的是,A-Softmax 损失是为了学
习区别性人脸嵌入而开发的。正如我们的实验所证实的那样,与超球面流形的明确联系使
我们的学习特征特别适用于开集 FR 问题。另外,A-Softmax 损失中的角边界是明确施
剩余23页未读,继续阅读


















安全验证
文档复制为VIP权益,开通VIP直接复制

评论0