年龄不变人脸识别：互信息最小化的多任务学习方法

60 浏览量更新于2023-10-14 收藏 1.05MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

3692年龄不变人脸识别的解纠缠表示：互信息最小化的观点薛戈侯雅丽李胜金王*清华大学hxg19@mails.tsinghua.edu.cn{liyali13，wgsgj} @tsinghua.edu.cn摘要近年来，通用人脸识别已经取得了显著的进展。然而，由于面部外观和骨骼结构的显著改变，大的年龄差距仍然是一个很大的挑战在年龄不变人脸识别（AIFR）中，解纠缠在将人脸表征划分为身份相关和年龄相关两个分量中起着关键作用本文提出了一种基于互信息最小化的多任务学习框架（MT-MIM），它将解纠缠表示学习作为信息约束的目标年龄64十九二十一四三四十七十四三十二该方法训练解纠缠网络以最小化来自同一人的面部图像的身份分量和年龄分量之间的互信息，并且减少识别过程期间年龄变化的影响。为了定量度量解纠缠度，我们证明了互信息可以表示为度量。由此产生的身份相关的representations的年龄不变的人脸识别。我们在流行的公共领域人脸老化数据集（FG-NET，MORPH Album 2 ， CACD 和 AgeDB ）上评估了 MT-MIM，并在以前的最先进的方法上获得了显着的改进。具体来说，我们的方法在MORPH Album 2上超过基线模型0.4%，在MORPH Album 2上超过基线模型0.7%。这是令人印象深刻的改进99%以上的高准确度水平和94%的平均值。1. 介绍人脸识别是计算机视觉领域研究最广泛、最深入的课题之一。从传统的方法[45，36，33，28，15，49]到最近的深度基于学习的算法[15，51，50，47，10，59]，它已经取得了优异的性能，甚至在各种场景中超过了人类在所有的人脸识别系统中，年龄不变的*通讯作者图1. AIFR的示例图像。一条线的两端是同一个人。这在AIFR中很常见，因为年龄差距较大，类内变异大于类间因此，委员会认为，不仅人类会感到困惑，而且大多数通用的人脸识别模型也会以超过13%的规模退化[5]。人脸识别具有广泛的应用场景，包括寻找失踪多年的儿童、逃犯识别和护照验证等，具有重要的意义。然而，尽管在人脸识别方面取得了令人兴奋的进展，但在这些实际应用中的老化变化在人脸识别系统的设计和测试期间仍然未被充分探索。年龄不变人脸识别（AIFR）有三个挑战性方面：1）面部外观和解剖结构中与年龄相关的改变导致显著的类内变化，其随着年龄差距变大而增加。2)面部老化是一个复杂的过程，受内在和外在因素（即面部老化）的影响。遗传、性别、环境）。它同时对面部形状和纹理产生复合影响，使得年龄不变的模式学习变得困难。3)目前的跨年龄数据库不足以进行年龄和性别分布不平衡的训练，这限制了AIFR的性能。图1显示了一个典型的场景，同一年龄的不同个体看起来比不同年龄的同一个人更相似，原因是与年龄相关的信息在不同的身份之间共享，揭示了年龄差异解缠的必要性3693MIM相同人或不？MIM年龄图2.我们建议通过最小化身份相关特征和年龄相关特征之间的互信息来学习身份相关表示然后，身份表示可以用于面部识别或验证。目前AIFR的研究主要有三种模型设计：生成模型、判别模型和两者的混合模型。生成方法[10，59]提出合成不同年龄的人脸图像，然后用人工表示进行识别。得益于强大的基于GAN的模型，它们在生成的老化面部的质量上有所改善然而，生成模型仍然存在显著的首先，参数生成模型拟合老龄化过程相当困难和复杂，容易受到潜在因素的影响，并且因人而异。其次，生成过程通常是不稳定的，并且会引入额外的噪声。此外，由于不平衡的训练数据，基于学习的生成通常以面部的纹理变化为特征，忽略了形状变化。相反，最近关于判别方法的工作引起了越来越多的兴趣[15，51，50，47]。区分模型集中在面部表征的分解上，并且分离用于识别的身份相关组件。例如，[15]提出了隐藏因素分析（HFA）来分离身份相关信息和年龄相关信息。[51]使用联合学习的深度特征的线性组合来表示身份和年龄信息，类似于基于HFA的深度学习模型。使用OE-CNN [50]的另一项最近的工作以正交方式处理研究了判别式方法，指出了人脸表征解纠缠和身份相关特征提取在年龄不变人脸识别中的意义。在这项工作中，我们介绍了一种新的年龄不变的人脸识别框架，使用互信息最小化（MT-MIM），它解开了人脸特征的混合物分成两个几乎独立的部分：身份依赖性成分和年龄依赖性成分。图3示出了所提出的MT-MIM的架构。与相关系数相比，互信息可以捕获变量之间的非线性统计独立性，因此它可以用作真正独立的度量[22]。通过最小化两个组件的互信息，我们更专注于身份有效的信息，在年龄不变的特征学习，导致改进的识别性能与大的年龄变化的图像。总括而言，我们在这项工作上的主要贡献包括：1) 一种新的目标，学习年龄不变的人脸表示，通过最小化的身份相关的组件和年龄相关的组件之间的互信息。2) 我们通过在四个人脸老化数据集上进行的几次广泛实验证明了我们提出的方法的有效性，包括MORPHAlbum 2 [38] ， CACD [6] ， FG-NET [24] 和 AgeDB[32]。2. 相关工作年龄不变的人脸特征学习。传统方法或者利用形状和纹理变换[37，34]对老化过程进行建模，或者利用鲁棒的局部描述符[15，14，30，27，28]来补偿由于面部老化引起的面部识别退化。以前的方法非常依赖于先前的生物学知识，并且通常需要长时间流逝的大量标记的跨年龄人脸数据。对于后一种方法，例如，[14]开发了最大熵特征描述符（MEFD）和用于AIFR的鲁棒身份匹配框架。最近的方法主要基于深度神经网络[10，59，51，50，47]。从深层生成模型出发，提出了合成特定年龄的人脸图像并进行比较的方法。例如，[10]提出了一个年龄进展模块，可以对深层面部特征进行年龄进展。年龄不变模型（AIM）[60]联合执行跨年龄人脸合成和端到端识别，以相互促进。另一方面，区分性方法具有更简洁的策略，具有竞争力的性能。例如，OE-CNN [50]提出了将面部特征正交分解为特定于身份和特定于年龄的分量。[47]通过具有线性残差分解的解相关对抗学习框架（DAL）来分解两个分量与以往的工作相比，我们的工作解决了人脸表征解纠缠从一个更本质的互信息的角度，揭示了变量的内在相关性解纠缠表示学习。分解表征学习旨在从不同的数据变化中对解释性因素进行建模，这引起了相当大的关注[58，2，44，42，18]。以前承认-3694|身份分类器特征编码器特征分解单元MI估计器年龄分类器特征提取特征分解多任务学习图3.MT-MIM的概述它包括两个主要过程。初始特征F_init由特征编码器提取，然后通过特征分解单元分解为身份相关特征x_id和年龄相关特征x_age。最后，该批特征分别用于MI最小化正则化和分类工作人员使用标记的数据来将表示分解为身份相关和身份无关的信息（年龄、姿势、视点等）。[18]最小化跨模态分布之间的Wasser-stein距离，以便学习异质面部图像的不变深度特征表示。[56]通过提取光照不变特征改进的单模态人重新识别。还对无监督设置进行了探索[4，40，23，8]。例如，InfoGAN [8]通过最大化隐变量和数据变量之间的相互信息来分解潜在因素。[7]分解了变分下界，以解释β- VAE [19]如何在学习解纠缠表示中工作，并激发了β-TCVAE算法。[40]使用耦合的自动编码器来解开面部图像的外观和几何形状每个自动编码器在重建损失的监督下分别学习其中一个表示。交互信息和深度学习。在此之前，互信息（MI）已被用于解释深度学习框架[43，41]。随着最近MI估计的突破[8，3，9]，它被用作正则化器或目标来约束变量之间的独立性。[20、1、46]。Deep InfoMax [20]通过最大化深度学习网络的输入和输出之间的MI来研究无监督表示学习。 [1]提出了一种基于共享上下文多视图MI最大化的自监督表示学习框架。此外，MI最小化在信息瓶颈[13]，解纠缠表示学习[7]和各个领域中引起了越来越多的通过保留所有与标签相关的信息，同时最小化其他信息的数量，[13]确定了不同视图不共享的多余信息3. MT-MIM3.1. 问题形成与动机我们将输入面部图像表示为X，每个图像对应于身份标签y_id和年龄标签y_age。在训练阶段中，分别在对应标签的监督下从编码器E提取特征x_id和x_age。在测试阶段，只有身份特征x_id用于人脸识别。简单地说，学习身份表示的挑战可以被公式化为学习将输入数据映射到身份表示的分布p（xidx）对于年龄不变的人脸识别，期望的x_id是年龄不变的，同时保留身份信息。在这种情况下，我们仅考虑足以预测y_id并且对年龄信息不变的身份信息，其可以受到x_id和x_age之间的互信息的限制。互信息的优势在于，不管依赖关系是多么的非线性，MI严格地量化了一个变量所揭示的关于另一个变量的信息因此，与相关性[22]相反，它表现出变量之间真正的相互依赖性另一方面，在对深度神经网络的信息的深入解释工作中[41]，通过噪声机制的泛化被认为是深度神经网络所独有的，这是通过信息瓶颈策略实现的。细节部分丢失以获得一般化。受这种工作模式的启发，我们相信身份表征对年龄变化的鲁棒性可以通过遗忘相关信息来获得。在不违反由身份监督任务保证的身份预测的信息充分性的情况下，I（x_id;x_age）减少得越多，随着年龄变化的身份表示就越3695∫|∈|N--我J我QN2θ角年龄IDID年龄3.2. 互信息估计与最小化互信息是衡量两个随机变量相关性的一个基本量。变量X和Y之间的MI定义为：这是因人而异的。然而，不同的人在相同的年龄往往具有相似的特征，例如，皮肤、皱纹和斑点的状况。在面部表征中，年龄相关信息和身份相关信息这两个组成部分虽然有些纠缠，但本质上是独立的。I[X;Y]=dx dy p（x，y）logp（x，y）p（x）p（y）（一）受观察结果的启发，我们将身份相关信息和年龄相关信息建模为统计独立变量，称为年龄信息和id其中p（x，y）是联合概率分布，而p（x）和p（y）是边值。由于我们对最小化MI感兴趣，因此上限需要对MI进行估计。大多数以前的工作集中在下限估计[3，8]，然而，它们不符合MI最小化任务。我们的基本MI最小化方法遵循对比对数比上限（CLUB）[9]，该方法通过正负样本对之间的条件概率差来在我们的人脸表征解纠缠的情况下，条件分布p（x年龄xid）不可用，因此我们使用变分分布来近似它，信息，由向量x_id和x_age表示。为了简单起见，我们考虑两个分量的线性因式分解。我们通过FC层从初始特征中获得与年龄相关的特征，并且通过初始特征与年龄相关特征之间的差获得将FC层表示为函数X，并且XRd表示由编码器E从面部图像提取的初始特征。然后因子分解可以公式化为：xid=x+（xage），（5）我们将这种因式分解称为特征因式分解单元，这是分解初始I（xid; xage）：= Ep（xid;xage）[log qσ（xage|xid）]-Ep（xid）Ep（xage）[log qσ（xage|xid）]（二）特征同时转化为身份相关和年龄相关的特征。在因子分解之后，我们可以进行以下多任务学习。其中qσ（xagexid）是模型化的变分分布用参数为σ的神经网络Q。为了鼓励特征对（x_age，x_id）i= l中的变量之间的依赖性，我们具有用于特征编码器E的以下MI最小化目标函数：3.4.多任务学习框架如图3所示，AIFR是通过多任务学习框架完成的。它有三个模块：身份鉴别器、年龄鉴别器和MI估计器。NN年龄鉴别器。训练年龄鉴别员minL=1ΣΣ[logq（xii=1j=1|x )MT-MIM，我们将训练数据集划分为几个年龄组，类似于以前的作品[15，51]。取决-log qθ（x年龄|xid）]在训练数据量上，年龄组的数量从8到10不等。每个年龄段都有大约与此同时，Q是训练通过最小化真实条件分布p（x年龄）之间的KL散度|xid）和变分分布qσ（x年龄|xid）：minLKL=KL （p（x 年龄|xid）qσ（xage|xid））（4）我们可以很容易地推导出这个方程。4相当于最大-同样的数据量来平衡样本。我们还探索了按年龄分型，但效果不如前者。我们相信这是因为年龄标签是粗糙的噪音。这里使用具有交叉熵损失的Softmax层进行年龄分类。身份鉴别器。考虑到重要的每-E的最小化p（xid，xage）[logqσ（x年龄|xid）]并最大化基于边缘的方法的性能[48，11]在一般情况下为了更好地保存身份信息，我们作为无偏估计的对数似然。对于MI估计器Q的训练，在每个训练iter处：利用ArcFace损失[11]来学习xid。损失函数被公式化为：为了取得成功，我们首先要取得一批样品。（xi，xi）Σfrom特征编码器，然后我们更新MI估计器。后1Σes（cos（θyi+m））更新，我们计算MI估计方程。3和后传播到特征编码器的参数。LID=N-日志我es（cos（θyi+m））+Σj伊伊scos（θj）（六NEMIM（三）3696IDIDID22）3.3.表示分解有一种观察，即同一个人的面部图像包含随着年龄的增长而持续的内在信息，其中N是恒等式的个数，cos（θj）=|xi·Wj|是第i个fea之间角度的余弦。||2·||W J||2||2真实xi并且标号y是3697Li=1×个ID年龄--.ΣS> 0是控制角度裕度的大小的超参数，并且S>0是可调整的缩放因子。ArcFace损失用于约束身份相关特征并鼓励特征区分。该算法以较高的权重系数保证了MI估计器。MI估计器作为解纠缠约束来操作，以减少身份相关特征和年龄相关特征之间的互信息。在多任务的联合监督下，xid被鼓励具有区分性和年龄不变性。总而言之，多任务学习损失函数被公式化为：L=LID+λAGELAGE+λMIMLMIM（7）其中AGE表示年龄任务的交叉熵损失λAGE、λMIM是用于平衡损失的超参数。训练MT-MIM的细节总结在Algo-1中Rithm14.算法1训练MT-MIM框架要求：训练集xiN，学习率γ，拉格朗日乘子λi和MI训练迭代NMI。确保：然后编码器参数Θ。1：通过预训练模型初始化参数Θ;2：对于每个训练时期，3：CNN优化：4：编码器正向：E（x，i）5：通过等式2计算身份损失。6个;6：用交叉熵损失计算年龄损失;7：通过等式10计算MI损失。3个;8：经由反向传播方法更新Θ9：MI估计器优化（Θ固定）：10：对于k=l至NMI，做11：通过最大化来更新MI估计器参数σing方程4个;12：结束13：结束14：返回Θ;4. 实验4.1. 实验设置数据预处理。我们通过MTCNN [57]检测所有训练和测试集，并根据五个地标（两只眼睛，鼻子和嘴角）进行相似性变换。在面部对齐之后，所有面部被裁剪为112 112RGB图像。最后，通过减去127.5并除以128来归一化经处理的面部的每个像素。CNN Architecture. 1）主干：为了公平起见，实验中的所有CNN模型都遵循相同的典型ResNet50架构[17]。它有四个残差块，并通过FC层输出512维特征向量。2)残差分解单元：年龄相关特征通过FC层从初始面部特征映射，并且身份相关特征从剩余部分导出。3）年龄鉴别器：通过FC层映射提取的X 年龄4)身份鉴别器：提取的x_id用于通过ArcFace损失进行分类。5)MI估计器：以一批样本（xi，xi）为输入，利用MI估计器计算两个变量之间的MI，以进行优化。培训详情。我们在几个广泛使用的AIFR数据集上进行了实验： MORPH Album 2 ， CACD ， FG-NET 和AgeDB。我们首先在野生数据集上训练深度模型，以学习有关人脸的基本知识。训练数据包括Ms-Celeb-1M [16]和CASIA-Webface [12]，我们在下文中将其称为通用人脸数据集（GFD）。Ms-Celeb-1 M包含来自10万个人的约100万张图像，而CASIA-Webface包含来自1万个人的近0.50万张图像。我们清除数据中的噪声[53]。然后，我们使用实验数据集微调所提出的模型。年龄标签被分成8至10组以用于数据平衡。然后将分组的年龄标签用于年龄分类。MT-MIM训练过程由Eq. 7 .第一次会议。具体地，以替代方式操作特征编码器和MI估计器的训练。在一个训练时期，我们执行编码器的前向一次，然后MI估计器优化5次。在Eq. 7是λAGE=0。1，λMIM=0。0001，m=0。35和s=64。所有模型都通过自适应矩估计（Adam）在4个Tesla V100 GPU上并行训练具体地，批次大小在不包括FG-NET的数据集中为400，并且对于FG-NET的留一训练方案为1001。微调编码器的学习速率开始于0.02并且当损耗不减小时除以10。而MI估计器的学习率初始设置为1 e-5，并与前者一样退化。测试详情。我们在公共AIFR数据集上进行评估实验：FG-NET、MORPH Album 2、CACD和AgeDB。在测试阶段，我们将从原始图像和其翻转图像中提取的身份相关特征连接起来进行识别。然后使用这些身份表示的余弦相似性来进行人脸验证和识别。指标 . 除了秩 -1 验证率之外，平均平均精度（MAP）被用作CACD数据集中的评价指标。对于每个查询图像的检索结果，计算每个召回率水平下的精确度，并将其平均以得到平均精确度（AP）。然后计算MAP3698∈|Q|Miik整个查询集Q，公式如下：方法设置-1/设置-2|Q|MiHFA（2013）[15]91.14/-MAP（Q）=1Σ1ΣPrecision（R）（8）i=1i=1CARC（2014）[6]MEFA（2015）[14]92.80/-93.80/-其中Rik是从第一图像到第k图像按降序的qiQ的检索结果，并且精度（Rik）是Rik中的正图像的比率。4.2. AIFR数据集在MORPH数据集上。MORPH是一个大规模的公共纵向人脸数据库。Album 2有两个版本用于商业和非商业用途，它们具有几乎相同的数据分布，并在以前的作品中交替使用。非商业版本包含MEFA+SIFT+MLBP（2015）[14][51]第GSM（2017）[29]AE-CNN（2017）[61]OE-CNN（2018）[50]DAL（2019）[47][ 59]第59届中国国际汽车工业展览会MT-MIM94.59/-97.51/--/94.40-/98.1398.55/98.6798.93/98.9799.13/98.8199.65/99.26-/99.43超过55，000张13，000个人的图像，年龄从17岁到77岁不等，而商业用途的版本包含超过78，000张20，000个人的面部图像。有两个基准设置，其中测试集分别由10，000个受试者和3，000个受试者组成。请注意，我们在这里使用的数据集是具有13，000个个体的非商业版本，因此我们遵循[29]中的测试方案将数据集分为两部分。一部分，包括10，000个个体，用于微调所提出的MT-MIM，其余3，000个个体用于评估。这两部分之间没有重叠。在测试集中，选择每个受试者具有最大年龄差距的2个图像以形成探针集和图库集。识别结果用Rank-1识别率进行评价。如表1所示，MT-MIM有效地改善了MORPH专辑2的秩-1识别性能特别地，用较少的AIFR训练数据来微调模型，我们的方法超过AIM模型0.6%，这是对AIM模型的显著改进。准确率在98%以上。我们还显示了一些失败的检索图的例子-图4.虽然秩-1检索在这些情况下是不正确的，但探针图像似乎比正确图像更类似于不正确的秩-1检索。在CACD数据集上。CACD是一个用于跨年龄人脸识别和检索的大规模数据集，在野外收集，具有不同的变化。它包含163，336张来自2，000位名人的面部图像，年龄从16岁到62岁不等在[6]中的实验设置之后，1880个名人用于微调MT-MIM，而左边的120个用于测试。其中，2013年拍摄的图像作为查询图像，其余2004-2006年、2007-2009年和2010-2012年拍摄的图像分为三组作为数据库图像。表2显示了CACD与其他最先进方法的检索结果比较基线模型优于现有的方法，但我们的方法在高于表1.在MORPH Album 2上进行1级准确度（%）比较年龄352017 47 2740 42 205523三九二一十九四八三十图4.MORPH Album 2中检索失败的一些示例第一行表示探针图像。第二行是使用我们的方法的错误检索。第三行示出了探头图像的对应图库图像。平均94%，在不同年份持续显示有效性。我们还可视化CACD的验证结果图5显示了探针和参考对的几个实例。余弦相似性显示在对之间。可以观察到，MT-MIM在具有各种年龄间隙的配对上具有稳定的性能。此外，所提出的方法在来自不同年龄的不同人但看起来非常相似的对上有利地执行在FGNET数据集上。FG-NET [24]是一个流行的跨年龄人脸识别公共数据集，在野外收集，从儿童到老年人的年龄差异很大。它包含来自82个个体的1002张人脸图像，年龄范围从0到69。为了与以前的方法进行公平比较，我们遵循与[15，28]相同具体来说，我们留下一个图像作为测试样本3699表3.FG-NET在leave-one-out协议下的结果表2. CACD数据集与现有方法的比较。2015年VGG Face [35]89.892016年《中心损失》[52]93.720. 九三四四-0.16872017年《RJIVE》[39]55.202017年《SphereFace》[31]91.70CosFace（2018）[48]94.56ArcFace（2019）[11]95.150. 九五二八-0.0966DAAE（2020）[26]95.30MT-MIM96.10表4. AgeDB-30上的性能比较0. 八二一二-0.0859母育酚，每个折叠由300个类内和300个类间配对。我们严格遵守30年来进行10倍交叉验证，以确认0. 九八三六-0.1724我们方法的有效性表4.2显示了Rank-1 MT-MIM的验证性能与(a) 最佳匹配病例（b）最佳非匹配病例图5.使用MT-MIM的CACD中匹配和非匹配对的一些示例。并使用剩余的1，001个图像训练（微调）模型我们重复这个过程1，002次，并报告平均rank-1识别率。表3中报告了所提出的MT-MIM与FG-NET上的其他最先进技术的面部识别性能比较。所提出的方法提高了1%的第二个最好的。建议使用更多的AIFR数据[50，59]进一步改进该模型，揭示了我们的方法用于具有年龄方差的无约束人脸识别的潜力。在AgeDB数据集上。AgeDB [32]是一个野生数据库，包含568个个体的16，488张人脸图像，带有手动注释的年龄标签。它提供了四种协议，用于在不同年龄差距的人脸对下进行年龄不变的人脸验证：5、10、20和30年。类似于LFW [21]，该数据集被分为10倍，用于每个亲-其他最新的AIFR方法，证明所提出的方法的竞争性能。4.3. 消融研究为了证明所提出的MT-MIM方法的有效性，我们进行了烧蚀评估的几个公共AIFR 数据集，包括 FG-NET，MORPH专辑2，CACD和AgeDB-30。考虑我们的方法的以下变体：1）基线：基线模型仅由ArcFace损失来训练，而没有任何其他监督。它使用一般人脸数据集（GFD）进行预训练，然后通过与AIFR测试集对应的指定训练集进行微调我们将微调后的模型表示为我们的基线模型，与其他方法中使用AIFR数据集训练的模型相比，不失一般性。2)+年龄：该模型基于预训练模型通过身份标签和年龄标签的联合监督来在没有任务关系建模的情况下，联合学习任务的性能不会得到提升[25]。3)MT-MIM：在预训练模型的基础上，在具有MI最小化约束的联合监督如表4.3所示，方法等级-1（%）方法2004-20062007-20092010-2012HFA（2013）[15]50.5853.0156.12CARC（2014）[6]52.7255.4861.38GSM-1（2017）[29]53.7957.8363.92GSM-2（2017）[29]55.4558.7464.58加拿大（2017年）[54]62.3367.6973.24AE-CNN（2017）[61]70.0172.8778.25CNN基线（使用GFD预训练）68.2171.4676.79CNN基线（由CACD微调）91.8193.2795.35MT-MIM92.6393.9596.09方法等级-1（%）Park等人（2010）[33]37.40Li等人（2011）[28]47.50HFA（2013）[15]69.00MEFA（2015）[14]76.20[51]第88.10加拿大（2017年）[54]86.50DAL（2019）[47]94.503700模型变形专辑2CACD（2004-2006年）CACD（2007-2009年）CACD（2010-2012年）FG-NETleave-one-outFG-NET（MF2）AgeDB-30基线99.0091.8193.2795.3593.2060.2695.11+年龄99.1091.8793.1595.4493.4060.0495.40MT-MIM99.4392.6393.9596.0994.2161.1296.10表5.MT-MIM与基线模型的比较图6. (a)到（b）：在训练期间，x年龄（蓝点）从xid迭代CACD（2004-2006年）CACD（2007-2009年）CACD（2010-2012年）1910091.4692.9395.222674092.2893.5595.643280092.3193.6295.68表6.CACD培训期间的性能动态基线模型在没有MT-MIM训练的情况下获得相当的性能。然而，我们的MT-MIM改进了基线的性能，具有相当大的规模。改进在MORPH Album 2上超过0.4%，在AgeDB-30上约1%，这在高于99%和95%的高准确度水平下是显著的改进。此外，MT-MIM还对CACD和FG-NET进行了大幅度的我们相信，随着训练数据集的年龄变化，所提出的方法的性能可以进一步提高。为了更好地理解MT- MIM的机制，我们将训练细节可视化。图6示出了在训练过程期间身份依赖性和年龄依赖性特征的MI变化。如图6所示，与“w/o MI损失”模型相比，MT-MIM模型的相互信息在身份依赖性和年龄依赖性特征之间受到相当大的抑制。MT-MIM训练过程中的检索结果也证实了该方法的有效性。如图6所示，CACD上的检索性能随着身份依赖特征和年龄依赖特征之间的MI的降低而不断提升，对应于图6中的现象。这些观察结果证明，我们的方法鼓励推断的年龄信息中的身份相关的功能，从而身份相关的功能可以更强大的年龄变化。随着ArcFace损失的联合监管，MI[51]第99.10跨年龄OE-CNN（2018）[50]99.35方法DAL（2019）[47]MT-MIM99.4799.25表7.LFW上的性能比较最小化可以实质上提高学习的身份特征的辨别能力。4.4. LFW实验《Labled Faces in the Wild》（LFW）[21]包含了从互联网上获得的5,749个身份的13,233张人脸图像。在表4.4中报告了所提出的MT-MIM与LFW上的其他最先进方法的面部识别性能比较。MT-MIM在LFW数据集上的识别性能与其他方法相当，验证了MT-MIM在一般人脸识别中的推广性5. 结论我们提出了基于互信息最小化的多任务学习框架（MT-MIM），通过最小化身份和年龄相关成分之间的互信息来分解人脸表征。据我们所知，这是第一个工作，引入相互信息解纠缠特征学习AIFR。在测试阶段，只有身份特征用于人脸识别。在公共AIFR基准上进行的评估证明了我们所提出的本工作得到国家自然科学基金项目的资助。国家“十三五”重点发展计划项目（批准号：044007008），北京国家信息科学技术研究中心跨媒体智能技术项目（批准号：044007008），北京市信息科学技术研究中心跨媒体智能技术项目（批准号：044007008），北京市信息科学技术研究中心跨媒体智能技术项目（批准号：044007008），北京市信息科学技术研究中心跨媒体智能技术项目（批准号：0444007008），北京市信息科学技术研究中心跨媒体智能技术项目（批准号：04444007008），北京市信息科学技术研究中心跨媒体智能技术项目（批准号：0444444007008），北京市信息科学技术研究中心跨媒体智能技术项目（批准号：044444444440007008），北京市信息科学技术研究中心跨媒体智能技术项目（批准号：04444 BNR2019TD01022和批准号为BNR2019TD01022的研究基金。2019GQG0001来自清华大学郭强研究所方法等级-1（%）一般方法2016年《中心损失》[52]2017年《SphereFace》[31]99.2899.4299.333701引用[1] Philip Bachman ， R Devon Hjelm ， and WilliamBuchwalter.通过最大化跨视图的互信息来学习表示arXiv预印本arXiv：1906.00910，2019。三个[2] Jianmin Bao，Dong Chen，Fang Wen，Houqiang Li，and Gang Hua.面向开集身份保持的人脸合成。在IEEEConf. Comput.目视模式识别，2018年。二个[3] Mohamed Ishmael Belghazi 、 Aristide Baratin 、 SaiRajesh- war 、 Sherjil Ozair 、 Yoshua Bengio 、 AaronCourville和De- von Hjelm。互信息神经估计。在Int.马赫会议学习. ，2018年。三、四[4] Yoshua Bengio Aaron Courville和Pascal Vincent表示学习：回顾与新的视角。IEEE传输模式分析马赫内特尔，2013年。三个[5] B. Chen C.，马缨丹属Chen和W. H. Hsu.使用跨年龄参考编码和跨年龄名人数据集的人脸识别和检索。IEEETrans. Multimedia，2015. 一个[6] Bor-Chun Chen，Chu-Song Chen，and Winston H Hsu.用于年龄不变人脸识别和检索的跨年龄参考编码。以Eur.确认补偿目视，2014年。二六七[7] 李雪晨，陈天勤，罗杰·格罗斯，大卫·杜维诺.变分自动编码器中解纠缠的分离源。 arXiv 预印本 arXiv ：1802.04942，2018。三个[8] Xi Chen，Yan Duan，Rein Houthooft，John Schulman，Ilya Sutskever，and Pieter Abbeel. Infogan：通过信息最大化生成对抗网络进行可解释的表示学习。arXiv预印本arXiv：1606.03657，2016。三、四[9] Pengyu Cheng ， Weituo Hao ， Shuyang Dai ， JiachangLiu，Zhe Gan，and Lawrence Carin.Club：互信息的在Int. Conf. 马赫学习. ，2020年。三、四[10] Debayan Deb，Divyansh Aggarwal，and Anil K Jain.寻找失踪儿童：衰老的深层面部特征。arXiv预印本arXiv：1911.07538，2019。一、二[11] 邓健康，贾国，薛念南，Stefanos Zafeiriou。Arcface：用于深度人脸识别的附加角度余量损失。在IEEE会议Comput. 目视模式识别，2019年。四、七[12] Y.东湖，澳-地Zhen，S. Liao和S. Z.李从头开始学习面部表情。计算机科学，2014年。五个[13] Marc oFederici ， AnjanDutta ， PatrickForre' ， NateKush-man，and Zeynep Akata. 通过多视图信息瓶颈学习鲁棒表示。arXiv预印本arXiv：2002.07017，2020。三个[14] D.贡，加-地Li，Dacheng Tao，J.刘先生及李雪龙。一种用于年龄不变人脸识别的最大熵特征描述子。在IEEE Conf. Comput.目视模式识别，2015年。二六七[15] D.贡，加-地Li，D. Lin，J. Liu，and X.唐年龄不变人脸识别的隐藏因素分析。在Int. Conf.Comput.目视，2013年。一二四六七[16] Y. 郭湖，加-地Zhang，Y.Hu，X.He和J.高. Ms-celeb-1m：大规模人脸识别的数据集和基准。EUR.确认补偿目视，2016年。五个[17] K. 他，X。Zhang，S.Ren和S.俭. 用于图像识别的深度残差在IEEE Conf. Comput.目视模式识别，2016年。五个[18] 何冉、吴翔、孙哲安、谭铁牛。瓦瑟-斯坦CNN：nir-vis人脸识别的学习不变特征。 IEEE传输模式分析马赫内特尔，2018年。二、三[19] Irina Higgins 、 Loic Matthey 、 Arka Pal 、 ChristopherBurgess 、 Xavier Glorot 、 Matthew Botvinick 、 ShakirMohamed和Alexander Lerchner。beta-vae：使用受约束的变分框架学习基本视觉概念。Int. Conf.学习.代表。，2017年。三个[20] R Devon Hjelm 、 Alex Fedorov 、 Samuel Lavoie-Marchildon 、 Karan Grewal 、 Phil Bachman 、 AdamTrischler和Yoshua Bengio。通过相互信息估计和最大化来学习深度表示。arXiv预印本arXiv：1808.06670，2018。三个[21] Gary B Huang，Marwan Mattar，Tamara Berg，and EricLearned-Miller.在野外贴上标签的脸：研究无约束环境中人脸识别的数据库。在“现实生活”图像中的面孔研讨会：检测、对准和识别，2008年。七、八[22] Justin B Kinney和Gurinder S Atwal。公平性、互信息和最大信息系数。Proceedings of the National Academy ofSciences，111（9）：3354二、三[23] Brenden M Lake ， Tomer D Ullman ， Joshua BTenenbaum，and Samuel J Gershman.制造像人一样学习和思考的机器。行为和大脑科学，40，2017。3[24] 放大图片作者：Christopher J.作者声明：John W. 自动模拟人脸图像上的老化效应IEEE传输模式分析马赫内特尔，2002年。二、六[25] Jianshu Li ， Pan Zhou ， Yunpeng Chen ， Jian Zhao ，Sujoy Roy，Yan Shuicheng，Jiashi Feng，and TerenceSim.任务关系网络。2019年IEEE计算机视觉应用冬季会议（WACV），第932-940页。IEEE，2019。7[26] Peipei Li，Huaibo Huang，Yibo Hu，Xiang Wu，RanHe，and Zhenan Sun.通过解开潜在特征的层次化人脸老化。以Eur.确认补偿目视，2020年。七个[27] 李志峰、龚地红、李雪龙、陶大成。衰老人脸识别

下载后可阅读完整内容，剩余1页未读，立即下载