没有合适的资源?快使用搜索试试~ 我知道了~
Auto-ReID:人员重新识别的自动化搜索方法
3750Auto-ReID:搜索用于人员重新识别全瑞杰1,2,董宣义1,2,吴宇1,2,朱林超2,杨毅21百度研究2ReLER,悉尼{ruijie.quan,xuanyi.dong,yu.wu-3}@ student.uts.edu.au{linchao.zhu,yi.yang}@ uts.edu.au摘要用于人员重新识别(reID)的流行深度卷积神经网络(CNN)通常建立在ResNet或VGG骨干上,这些骨干最初是为分类而设计的。由于reID与分类不同,因此应相应地修改体系结构我们建议自动搜索CNN架构,特别适合reID任务。有三个方面需要解决。首先,身体结构信息在reID中起着重要作用,但它不编码在主链中。其次,神经架构搜索(NAS)自动化的架构设计过程,而不需要人力的努力,但现有的NAS方法没有纳入输入图像的结构第三,reID本质上是一个检索任务,但目前的NAS算法仅仅是为分类而设计的。为了解决这些问题,我们提出了一个基于检索的搜索算法在一个专门设计的reID搜索空间,名为Auto-ReID。我们的Auto-ReID使自动化方法能够为reID找到高效且有效的CNN架构。大量的实验表明,搜索架构达到最先进的性能,同时减少50%的参数和53%的FLOPs相比,其他。1. 介绍人员重新识别(reID)旨在检索由不同监控摄像头记录的人员图像[17,38]。随着近年来深度卷积神经网络(CNN)的成功,该领域的研究人员主要关注于提高从CNN模型中提取的特征的表示能力[27,38,30]。已经为reID设计了数百种不同的CNN模型,市场上的rank-1准确率从44.4%[38]提高到93.8%[30]1501基准[38]。部分工作是在Ruijie Quan、Xuanyi Dong和Yu Wu在百度研究院实习时易阳为通讯作者。图1.我们的Auto-ReID学习在特定的reID数据集上搜索合适的架构,并且在搜索过程中由检索目标监督Auto-ReID从reID搜索空间中查找架构,该空间由大量候选架构组成。这些候选项是通过组合基本操作生成的,例如3 × 3卷积层、3 × 3最大池化操作和所提出的部分感知模块。最近的reID模型基于深度CNN。它们通常建立在卷积神经网络骨干上,用于图像分类[36,17,27,28,30],例如[26],[ 31 ],[32],[33],[34]。由于这两个任务的输入都是图像,因此这些主干可以很容易地用于检索。然而,reID任务和分类任务之间仍然存在一些差异。例如,在图像分类中,两个对象的外观可能不同,例如,猫看起来和树不一样。相反,reID任务的所有输入示例都是具有不同属性的人物图像,例如,服装或发型。一个专注于识别超过1,000个对象的CNN[7]在应用于reID任务时应该进行修改。一个简单的方法是手动设计一个面向reID的CNN架构,它特别适合于3751能够解决reID问题。然而,即使对于人类专家来说,为reID任务手动设计精致的架构也可能需要数月[42,22,20]。这是低效且劳动密集型的。在本文中,我们提出了一种自动方法来搜索明确适合reID任务的最佳CNN架构。我们的前提是,为分类设计的CNN主干可能具有冗余和缺失的检索组件(reID任务),例如,(1)较少的池层有利于reID准确性,(2)没有用于分类的组件明确地捕获身体结构信息。自动化ReID的神经架构搜索(NAS)首先,没有现有的NAS方法搜索保留身体结构信息的CNN架构身体结构信息在reID中起着重要作用,这是reID和分类之间的主要差异[28,17]。其次,reID方法通常以主链依赖的方式编码结构信息。当采用不同的骨干网络时,它们需要对超参数进行大量的手动调整[30,24]。第三,reID本质上是一个检索任务,但大多数NAS算法是为分类而设计的由于检索和分类具有不同的目标,现有的NAS算法不能直接应用于reID问题[42,22,19,20]。在本文中,我们提出了一种称为Auto-ReID的方法Auto-ReID的主要贡献在于设计了一个新的reID搜索空间。这种设计使我们能够构造出更优化的建筑物,最大限度地利用人体结构信息。具体地说,我们设计了一个部分感知模块来增强给定输入特征张量的身体结构信息。与现有的基于部件的reID模型不同,所提出的部件感知模块是灵活的,能够处理具有各种输入形状的特征。我们使用这个模块作为基本操作来构造一些reID候选体系结构。除了典型的softmax损耗外,建议的Auto-ReID还配备了可区分的NAS方法[20] 具有检索损失,使得搜索结果特别适合于reID任务。所提出的reID搜索空间和reID搜索算法的组合使我们能够以自动化的方式找到用于reID的高效且有效的架构(图1B)。①的人。概括而言,我们的贡献如下:• 这是第一种为reID任务搜索神经架构的方法,消除了人类专家• 我们提出了一种新的reID搜索空间,其中身体结构被制定为一个可训练和可操作的CNN组件。所提出的reID搜索空间结合了(1)明确捕获足部身体部位信息的模块和(2)已在标准NAS搜索空间中使用• 我们将检索损失集成到可区分的NAS算法中,以便更好地适应reID任务。我们采用了改进的搜索策略和批量数据采样方法按照新的检索目标。• 大量的实验表明,搜索的CNN实现了竞争力的准确性相比,reID基地-线,而这个CNN的reID基线参数不到40%。通过在ImageNet上对CNN进行预训练以进行初始化,我们在三个reID基准测试中实现了最先进的性能,而参数数量只有一半。2. 相关工作人员身份确认。主流算法在深度学习技术方面取得了巨大成功[36,5,24,15,30,10,8]。Xiao等人。[36]提出了一种从多个数据集进行深度特征表示的管道。Chen等人[5]设计了一个四元组损失,使深度CNN捕获类间和类内变化。Saquib等人[24]将身体关节映射作为额外的输入,使深度CNN能够学习姿势敏感的表示。Sun等人[30]利用基于部分的CNN模型和改进的部分池化方法来学习区分部分信息的特征。一方面,这些基于深度的reID算法[36,27,24,30,28]严重依赖分类CNN骨干,例如VGG [26],Inception [31]和ResNet [13]。这些CNN主干是专门为分类问题设计的,并在分类数据集上进行了实验,这些数据集可能与reID不一致,并限制了reID算法的性能。另一方面,他们结合了reID特定的领域知识来提升经典的CNN模型,例如部分线索[30,28],姿势[24]和reID特定的损失[5,14]。在这项工作中,我们不仅继承了以前的reID方法的优点,但也克服了他们的缺点。我们在reID搜索空间中自动找到reID特定的CNN架构。神经架构搜索。我们的工作是由最近的研究NAS[20,42,43,2,6,9,11,11,6]的动机,而我们专注于寻找一个高性能的reID模型,而不是一个分类模型。大多数NAS方法[20,42,43,2,22]在一个小的代理任务上搜索CNN,并将找到的CNN结构转移到另一个大的目标任务。Zoph等人。[42,43]应用rein-speaking学习来搜索CNN,而搜索成本超过数百个GPU天。Real等人。[23]通过引入年龄属性来修改锦标赛选择进化算法,以支持年轻的CNN候选人。Brock等人[2] Bender et al.[1]探索一次性NAS方法。Liu等人。[20]放 松 离 散 搜 索 空 间 , 以 便 以 可 微 的 方 式 搜 索CNN。Dong等人[9]提出了一种可微分采样方法来改进[20]。得益于参数共享技术-3752I1I1O奥我O我I1I1I1I2I1I2 I2I1我nique [22,20],我们放弃了代理范例,直接在目标reID数据集上搜索鲁棒的CNN。此外,以前的NAS算法[20,42,43,2,22,1]关注于分类问题。它们是通用的,并且可以应用于reID问题。然而,在不考虑reID特定信息的情况下,例如语义[16],遮挡[15],姿态[24]和部分[30],通用NAS方法无法保证搜索的CNN适用于reID任务。在这项工作中,基于一个有效的NAS算法[20],我们采用两种技术来修改它的reID问题。我们修改了目标函数和训练策略,以适应reID问题。此外,我们设计了一个局部感知模块,并将其集成到标准的NAS搜索空间中,这可以使我们找到一个更好的CNN,并推进NAS搜索空间的研究。3. 方法在本节中,我们将展示如何搜索具有高性能的reIDCNN。我们将首先介绍NAS的初步背景。第3.1条然后我们算法1Auto-ReID算法输入:结构参数α和操作参数ω;训练集DT和评估集DE;类平衡数据采样器;1:将DT拆分为搜索训练集Dtrain和搜索验证集Dval而不收敛2:使用采样器从Dtrain获取批量数据3:通过等式中的检索损失更新ω。(五)4:使用采样器从Dval5中获取批量数据:通过等式中的检索损失更新α(5)结束时,按照[20]中的策略从α通过标准的reID训练策略在训练集DT在评估集DE为了寻找方程中Oc和Ic(1),我们放松了特定操作的分类选择,作为所有可能操作的softmax [20]:提出一种新的reID搜索算法,秒3.2. 此外,我们设计了一个新的reID搜索空间Oc(Ic)=α(H,i)Σo(H)、⑵节中3.3,它集成了我们提出的部件感知模块和标准NAS搜索空间。最后,我们讨论I1I1H∈Ico∈Oo′∈O exp(α(H,i))一些未来的方向reID在Sec。三点四分。3.1. 预赛大多数NAS方法堆叠神经细胞的多个副本以构建CNN模型[43,19,23]。一个神经细胞由几种不同的层组成,取出-其中,α={α(H,i)}表示神经元的拓扑结构,称为结构参数。将O中所有运算的参数表示为ω,称为运算参数,这是一种典型的可微NAS方法[20]。联合训练训练集上的ω和验证集上的α。 训练后,定义H到Ic从以前的单元格中放入张量并生成新的输出为maxexp(α(H,i)). 的H ∈Ic,其中o∈O,o 无O(H,i)i张量我们遵循以前的NAS方法[42,43,20],寻找神经元的拓扑结构。具体地说,神经细胞可以被视为具有B块的有向无环图(DAG)。每个块有三个步骤:(1)取两个张量作为输入,(2)分别对这两个张量进行两种运算,(3)对这两个张量求和。应用的操作是从操作中选择的候选集O.根据以前的一些工作[22],我们在O中使用以下 操 作 : ( 1 )3×3 max pooling , (2 ) 3×3averagepooling,(3)3×3depth-wise separable卷积,(4)3×3扩张卷积,(5)零操作(无);(6)身份映射。第c个神经元中的第i个块可以将RAL单元表示为4元组,即, (Ic,Ic,Oc,o′∈Oexp(αo′ )选择最大强度作为Ic,并且选择具有Ic的最大权重的操作作为Oc。这个范例是为分类问题而设计的在-从他们的启发,我们应用几个改进,以适应这种模式到人reID问题。3.2. ReID搜索算法流行的NAS方法专注于在分类任务中搜索性能良好的架构,其中具有交叉熵损失的softmax被应用于优化α和ω[20,43]。相比之下,reID任务的目标是在训练过程中学习一个判别特征提取器,我1我 2我 1Oc)。此外,第c个神经元中第i个块的输出张量为:Ic=Oc(Ic)+Oc(Ic),(1)所提取的特征可以在评估期间检索相同身份的图像。简单地继承交叉熵损失并不能保证良好的检索性能.i ii1I1I2I2我们需要将reID的具体知识纳入其中OcOC是从O中选择的操作,搜索算法第i块。Ic和1c从候选输入网络结构。 我们使用的宏观结构张量Ic,其由来自最后两个神经细胞(Ic-1和Ic-2)的输出张量和来自当前细胞中的前一个块的输出张量组成。ResNet [13]用于我们的reID骨干,其中每个剩余层都被一个神经细胞取代。我们搜索神经细胞的拓扑结构。表示提取自3753我我我我图2.针对reID搜索空间提出的部件感知模块。给定行人特征张量,该模块可以将人体结构线索集成到输入张量中。它首先将输入特征张量垂直拆分为M= 4个身体部位特征,然后将每个部位张量平均为一个向量,并使用线性层将它们中的每一个转换为新的部位特征向量,表示为“身体向量”。这M个部位向量通过自注意机制相互作用,并且每个部位向量可以包括更多的身体部位特定信息。随后,这些M个向量被重复和连接,以将它们恢复为与输入张量相同的空间形状,称为最后,我们通过一个接一个的卷积层融合这个全局特征张量和原始输入张量骨干为f,我们使用一个嵌入层将特征f转换为g[30],并且我们使用另一个线性变换层将特征g映射到输出维度为C的log-其h,其中C表示训练身份的数量分别在fg和gh之间添加两个dropout层Objective. 分类模型通常应用softmax在h上的交叉熵损失如下:从交叉熵和三重态损失的相互受益,我们考虑Ls和Lt的混合检索损失如下:Lret=λLs+(1−λ)Lt,(5)其中λ∈[0,1]是Ls和Lt的权平衡。我们在Alg中展示了我们的整体算法(Auto-ReID)1、它解决了一个双层优化问题[9,20,21,42]。我们首先通过交替操作来搜索鲁棒的reID模型ΣNLs=-logΣexp(hi[c])、(3)用Lt最小化α,用Lret最小化ω。 搜索CNN基于与[20,9]相同的策略从α导出i=1Cc′=1 exp(hi[c′])在我们为reID任务找到一个健壮的CNN之后,我们以标准的方式训练和评估这个CNN。其中hi指示第i个样本的特征h,并且hi[c]表示hi中的第c个元素。N是训练期间的样本数。reID模型通常将三重态损失应用为:ΣNLt=max(ma r gin,||fi−f p||−||fi−f n||)、(4)3.3. 使用部件感知模块的ReID搜索空间搜索空间覆盖所有可能的候选CNN,这对NAS很重要。NAS中的标准搜索空间是i=1我我池化层等。这些层都不能明确地处理行人信息,这需要一个微妙的de-其中fi表示第i个样本的特征f。 f p表示fi的最硬的正特征。 边际项表示三重态损失的边际。换句话说,fp是具有fi的最大欧氏距离和fi在一批中的相同恒等式的另一个特征。fn是fi的最难的负特征。换句话说,fn是具有fi的最小欧氏距离和fi在同一批中的不同恒等式的另一个特征。由于三重丢失对批量数据很敏感,我们应该仔细地对每个批次中的训练数据进行我们采用了类平衡数据采样器对三重态丢失的批量数据进行采样该采样器首先对一些身份进行均匀采样,然后对每个身份随机采样相同数量的图像。要与reID问题保持一致并利用符号和一些独特的操作。在本文中,我们采取的第一步,探索适合的reID问题的搜索空间身体部位信息可以提高reID模型的性能[30,27],受此启发,我们设计了一个部位感知模块,并将其与通用search space(O)来构造我们的reID search spaceOreid:(1)部分感知模块,(2)3×3最大池化,(3)3×3平均池化,(4)3×3深度可分离卷积,(5)3×3扩张卷积,(6)零操作,以及(7)恒等映射部件感知模块如图所示。二、给定输入特征张量F,我们首先将其垂直地分成M个部分,其中我们在图2中示出了M=4的示例。在我们获得部分特征后,我们3754对每个池进行平均,3755架构地图秩-1秩-5十阶参数(M)FLOPs(G)ResNet-18 [13]66.085.294.696.511.61.7ResNet-34 [1]68.086.794.896.621.73.4ResNet-50 [1]68.587.295.597.125.13.8DARTS [20]65.285.694.396.49.11.7GDAS [9]66.886.594.796.913.52.3基线(运行1)68.587.095.497.111.92.0基线(运行2)68.286.895.697.310.81.9基线(运行3)65.885.895.096.88.61.6基线(运行4)66.586.595.096.99.01.7基线+ ReID搜索空间(运行1)71.390.096.597.710.91.7基线+ ReID搜索空间(运行2)71.289.196.197.514.82.2基线+ ReID搜索空间(运行3)74.690.796.998.113.12.1基线+ ReID搜索空间(运行4)72.289.396.697.814.62.0检索+ ReID搜索空间(运行1)72.789.796.798.011.41.8检索+ ReID搜索空间(运行2)73.490.296.497.714.52.3检索+ ReID搜索空间(运行3)73.189.596.697.913.12.0检索+ ReID搜索空间(运行4)74.290.396.697.914.12.1表1.我们分析了每个组件在我们提出的方法的效果。所有的CNN模型都采用相同的策略进行训练,并且不使用ImageNet预训练进行初始化。我们为每个搜索算法搜索四次,并显示其结果。在搜索过程中,我们使用C=32和l=[2,2,2,2]来提高效率。为了训练搜索到的架构,我们使用C=64和l=[2,2,2,2]来保持与ResNet-18类似的数字参数。在空间维度上的局部身体部位特征,并将线性变换应用于汇集的特征,并且因此可以获得M个局部身体部位特征向量。然后,我们对这些M部分特征向量应用自注意机制[32]。通过这种方式,我们可以将全局信息融入到每个部分向量中,以增强其身体结构线索。随后,我们将每个部分向量重复到其原始空间形状中,并将重复的部分特征垂直连接到身体结构增强特征张量中。最后,通过通道级级联的方式将该部分感知张量与原始输入特征张量进行融合,并在融合张量上应用一个逐个卷积层生成输出张量。我们设计的部分感知模块可以捕获有用的身体部位线索,并将此结构信息集成到输入功能。此外,所提出的部分感知模块的参数大小和计算数量与3x3深度可分离卷积相似,因此与使用标准NAS搜索空间相比,不会影响所找到的CNN的效率。3.4. 讨论在许多领域,研究人员的研究重点已经从人工体系结构设计转向自动化体系结构设计,分类[43,20,9]和分段[4]。在reID社区中,reID性能的突破通常得益于CNN架构的改进。我们提出了将自动化机器学习应用于reID的第一个努力。在为reID提出了如此多的不同架构之后[36],27,24,30,28],手动找到更好的架构变得更加困难。现在是时候自动设计一个好的reID架构了,据我们所知,这是第一次自动化算法使用架构搜索技术匹配4. 实验在本节中,我们对所提出的方法进行了经验我们将首先在第二节中介绍使用的数据集。4.1节中的实现细节。四点二。然后,我们将在第二节中详细研究Auto-ReID算法的不同方面。4.3,并将我们的方法发现的CNN与 SEC中的其他最先进算法4.4 最后,我们在第二章进行了定性分析。四点五分。4.1. 数据集和评估指标Market-1501是一个大规模的人reID数据集,包含从六个摄像头收集的19,372个图库图像,3,368个查询图像和12,396个训练图像。训练集有751个身份,测试集有750个身份,它们没有重叠。训练集中的每个身份平均有17.2张图像。CUHK03[17]由1,467个身份和28,192个边界框组成。有1,367个身份的26,264个图像用于训练,100个身份的1,928个图像用于测试。我们使用新的协议来分割训练和测试数据由[41]提出。MSMT17[34]是目前最大的个人reID数据集,其中包含4,101个身份375615个摄像头。该数据集由训练集和测试集组成,训练集包含1,041个身份的32,621个边界框,测试集包含3,060个身份的93,820个边界框。在测试集中,11,659个图像用作查询图像,另外82,161个边界框用作图库图像。这个具有挑战性的数据集具有更复杂的场景和背景,例如,室内和室外的场景,比其他人。评估指标。为了评估我们的Auto-ReID的性能并与其他reID方法进行比较,我们报告了两个常见的评估指标:秩-1、秩-5和秩-10的累积匹配特性(CMC)以及遵循常见设置的上述三个基准的平均平均精度(mAP)[38,34]。4.2. 实现细节搜索在搜索期间,我们从官方训练集中随机选择50%的图像作为搜索训练集Dtrain,其他图像作为搜索验证集Dval。 我们选择ResNet宏结构来构建整个网络。这个网络有一个3x3的卷积头和四个连续的块,每个块有几个神经细胞。 我们将每个块中的单元数表示为l1、l2、l3和l4。我们记为l=[l1,l2,l3,l4].我们将第一个卷积层的通道表示为C,每个块将使通道数量第2、第3和第4块中的第一个细胞是还原细胞,其他细胞是正常细胞[19,20]。默认情况下,我们使用C=32和l=[2,2,2,2]来搜索合适的CNN架构。在搜索过程中,我们使用的输入大小为384×128,批量大小为16,总epoch为200。我们利用动量SGD以初始学习率0.1优化ω,并在余弦调度器中将其降低到0.001。SGD的动量被设定为0.9。我们使用Adam优化α,初始学习率为0.02,在第60和第150个epoch时衰减10。SGD和Adam的权重衰减均设置为0.0005。当使用检索目标时,边距设置为0.3。λ被设置为0.5。在实验中,“Baseline” indicates we use DARTS (firstorder [我们使用我们使用“Retrieval + ReID搜索空间”来表 示 在 所 提 出 的 ReID 搜 索 空 间 上 的 基 于 检 索 的“Retrieval培训配置。在训练阶段,我们使用384×128的输入大小,C=64,l=[2,2,2,2]。在以前的作品中,我们使用随机水平翻转配置秩-1地图参数(M)搜索火车CLC=16l=[2,2,2,2]16[2,2,2,2]【三、四、六、三】81.279.558.953.51.11.732[2,2,2,2]【三、四、六、三】86.485.466.062.73.85.9C=16l=[3,4,6,3]16[2,2,2,2]【三、四、六、三】77.381.254.056.21.01.432[2,2,2,2]【三、四、六、三】85.987.266.066.53.14.9C=32l=[2,2,2,2]16[2,2,2,2]【三、四、六、三】80.780.358.356.71.21.932[2,2,2,2]【三、四、六、三】87.685.168.364.94.16.6C=32l=[3,4,6,3]16[2,2,2,2]【三、四、六、三】78.080.055.455.51.21.832[2,2,2,2]【三、四、六、三】85.686.566.264.63.96.2表2.我们在搜索和训练过程中使用不同的配置进行实验。除了C和l之外,对于不同的构型,我们保持其他超参数相同。以上所有实验都没有使用ImageNet预训练。3757和裁剪以增加数据。对于检索损失,我们将λ设为0.5。对于从头开始的训练,在一个批次中,我们的类平衡数据采样器将首先随机选择8个身份,然后为每个身份随机采样4个图像。当使用ImageNet预训练模型时,它随机采样16个身份,然后为每个身份采样4个图像。我们训练模型240个epoch,使用Adam作为优化器,动量为0.9,权重衰减为0.0005。我们从0.0035开始学习率,并在第80和第150个时期将其衰减10。4.3. 消融研究为了研究Auto-ReID中每个组件的影响,我们对Market- 1501数据集进行了广泛的消融研究我们将结果显示在表1和表2中。我们使用ImageNet预训练比较了表1中的四个搜索选项。我们做了几个观察:(1)在CIFAR-10上搜索DARTS [20]和GDAS [9],其中发现的CNN比基于ResNet-18的简单reID模型更差。(2)通过直接搜索reID数据集(“基线”),我们可以找到更好的CNN,平均而言,它们具有更高的mAP和rank-1准确度,参数和FLOP的数量相似。(3)通过在所提出的reID搜索空间上进行搜索,可以显着提高搜索的CNN的性能。(4)用检索搜索损失代替分类搜索损失,在大多数情况下,我们可以获得稍好的CNN尽管3758架构地图秩-1参数(M)FLOPs(G)DARTS [20]65.285.69.11.75GDAS [9]66.886.513.52.3基线68.587.011.92.03DARTS+PCB70.386.99.11.75GDAS+PCB68.186.613.52.3基线+PCB70.286.611.92.03自动ReID74.690.713.12.05表3.与Market- 1501上最先进的reID模型进行比较。“R-1”indicates the rank-1“基线+ ReID搜索空间(运行3)”是所有12次运行中准确度最高的架构。因此,我们默认使用此模型作为不同配置的效果。 在搜索和训练过程中,我们尝试不同的配置。我们使用结果示于表2中。首先,在训练过程中使用更多的通道将产生更好的准确性和mAP。第二,只有当 搜索期间的L与训练期间的值相同。换句话说,由l=[2,2,2,2]搜索的神经元更适合于l=[2,2,2,2]的架构。第三,如果我们使用C=64或l=[3,4,6,3]进行表1中的实验,我们可能会找到更好的CNN。考虑到效率,我们在搜索过程中使用较小的C和l将部件感知模块公式化为一个可训练和可操作的CNN组件。我们为NAS搜索的模型配备PCB,并在表4中显示其结果。与利用尾部的部件模块相比,我们的方法搜索最合适的部件感知模块的数量和位置。因此,我们可以找到一个更好的架构,特别适合reID问题。如表4所示,我们的方法在mAP中以超过2%的大幅度优于表4.与手工制作的不同CNN主干和部分相关模块的组合进行比较。所有这些模型都没有在ImageNet上预先训练。4.4. 与最先进的ReID模型的比较由于所有最先进的reID算法都在ImageNet上预训练了它们的模型,因此我们也在ImageNet上预训练了我们搜索的CNN,以便在本节中进行公平的比较。我们在Market-1501上使用ImageNet初始化训练在市场上的结果-1501。表3将我们的方法与其他最先进的reID模型进行了比较。我们的基线搜索算法找到了一个CNN,它达到了93.8%的rank- 1准确率和83.4%的mAP,它优于其他最先进的reID算法。我们的Auto-ReID进一步提升了“Baseline”的性能我们的Auto-ReID发现的CNN实现了94.5%的rank-1准确度和85.1%的mAP。请注意,这种CNN将基于ResNet-50的reID模型的参数减少了45%以上,而它获得了比它们更高的准确性和mAP。该实验表明,我们的自动架构搜索方法可以找到一个高效和有效的模型,它成功地消除了其他典型骨干中的噪声,冗余和缺失组件。请注意,我们的Auto-ReID与其他reID技术正交,例如重新排序(RK)[41],如表3所示。使用相同的增强技术[41],我们的Auto-ReID也优于其他reID模型。例如,PCB+RK实现了91.9%的mAP,而Auto-ReID +RK实现了94.2%的mAP,比其高虽然其他技术可以进一步提高Auto-ReID的性能,但由于这不是本文的重点,因此我们不做更多的讨论。CUHK03的结果见表5。有两种类型人的边界框:手动标记和自动检测。在这两种设置下,我们的Auto-ReID获得了比其他模型更高的准确性和mAP。表6中的MSMT 17结果:MSMT 17上以前的最先进方法是PCB,我们的Auto-ReID显著优于它,mAP为12%,rank-1准确度为10%。我们对三个基准点提出了以下意见:(1)我们的Auto-ReID自动设计的CNN模型优于大多数最先进的reID模型,方法骨干Params(男)Market-1501R-1地图[40]第四十话ResNet50>25。182.863.3TriNet [14]ResNet-50二十五184.969.1AOS [15]ResNet-50>25。186.470.4MLFN [3]ResNeXt-50>25。090.074.3DuATM [25]DenseNet-121 >8。0 91.476.6PCB [30]ResNet-50二十七岁293.881.6[33]第三十三话ResNet-50>25。193.182.3HPM [12]ResNet-5025.194.282.7基线-11.993.883.4自动ReID13.194.585.1使用重新排序技术[41]。TriNet [14]ResNet-5025.186.781.1AOS [15]ResNet-50>25。188.783.33759方法秩-1秩-5十阶地图谷歌[31]47.665.071.823.0PDC [27]58.073.679.429.7GLAD [35]61.476.881.634.0PCB [30]68.281.285.540.4基线74.786.189.548.2自动ReID78.288.291.152.5表5.与CUHK03上最先进的reID模型请注意,我们使用[41]中报告的新在所有三个数据集上。(2)我们的Auto-ReID显著优于基 线 搜 索 算 法 。 虽 然 在 Market-1501 上 搜 索 “Auto-ReID”,但它在其他两个基准上达到了很高的准确性。这表明我们的搜索模型具有很强的可转移能力,当计算资源不足以直接搜索目标数据集时,可以在较小的代理数据集上进行搜索由于MSMT 17比Market-1501大得多,因此可以通过在MSMT 17上搜索来找到更好的CNN架构。当使用故障超参数在MSMT 17上搜索时,与“Auto-ReID”模型相比,它产生了稍微差一点的模型这是由于不同的数据集可能需要不同的超参数。通过仔细调整参数,我们相信可以使用MSMT17找到更好的CNN。未来的工作。我们的Auto-ReID迈出了自动化reID模型设计的第一步。所提出的reID搜索空间仅考虑一个可能的reID特定模块。更精心设计的基本reID模块可以受益于找到一个更好的reID架构。我们建议NAS的reID特定模块应满足以下要求:(1)增强人体结构信息;(2)消除不相关的reID(例如,背景)信息;(3)能够以任意形状的张量我们将在今后的工作中探讨这一点。此外,所提出的搜索算法是对前NAS算法的简单扩展[20]。在未来的工作中,我们将考虑更多的reID特定知识,以设计更高效和有效的搜索算法。4.5. 可视化为了更好地理解我们在搜索过程中发现了什么,我们在图中显示了我们搜索到的一个架构。3.第三章。我们展示了正常细胞和还原细胞。这些自动发现的细胞是相当复杂的,并且很难被人类专家通过手动调节发现表6. MSMT17上最先进的reID模型的准确度和mAP比较图3.表3、表5和表6中使用的正常电池和还原电池。这种拓扑结构比较复杂,很难由人类专家进行设计。如归约单元中所示,两个部件感知模块被并入架构中。手动设计一个类似的架构,如图。3将花费几个月,这是在效率和劳动密集型。这进一步表明,有必要自动化reID架构设计。5. 结论在本文中,我们提出了一个自动神经架构搜索的reID任务,我们将我们的方法称为Auto-ReID。Auto-ReID包含一个新的reID搜索空间和一个新的基于检索的搜索算法。所提出的reID搜索空间将身体结构信息合并到搜索空间中的候选CNN中。具体来说,它结合了一个典型的分类搜索空间和一个新的部分知道模块。由于reID本质上是一个检索任务,但目前的NAS算法仅仅是为分类而设计的。我们为NAS al-taxm配备了检索损失,使其特别适用于reID。在实验中,我们的Auto-ReID发现的CNN架构在三个基准测试中显著优于所有最方法标记检测秩-1地图秩-1地图[40]第四十话36.935.036.334.0SVDNet [29]40.937.841.537.3美国有线电视新闻网[18]44.441.041.738.6AOS [15]--47.743.3MLFN [3]54.749.252.847.8PCB [30]--63.757.5[33]第三十三话69.063.965.560.5[39]第三十九话--65.661.13760引用[1] Gabriel Bender,Pieter-Jan Kindermans,Barret Zoph,Vijay Vasudevan,and Quoc Le.理解和简化一次性架构搜索。在ICML,2018。[2] Andrew Brock、Theodore Lim、James M Ritchie和NickWeston。SMASH:通过超网络进行一次性模型架构搜索。在ICLR,2018年。[3] Xiaobin Chang,Timothy M Hospedales,and Tao Xiang.用于人员重新识别的多级分解网络。在CVPR,2018年。[4] 陈良杰、麦克斯韦·柯林斯、朱玉坤、乔治·帕潘德里欧、巴雷特·佐夫、弗洛里安·施洛夫、哈特维格·亚当和乔恩·施伦斯。寻找用于密集图像预测的高效多尺度架构。NeurIPS,2018。[5] Weihua Chen , Xiaotang Chen , Jianguo Zhang , andKaiqi Huang.除了三重态损失:一个深度的四元组网络用于人的重新识别。在CVPR,2017年。[6] Yukang Chen, Gaofeng Meng ,Qian Zhang ,ShimingXiang , Chang Huang , Lisen Mu , and XinggangWang.RENAS:强化进化神经结构搜索.在CVPR,2019年。[7] Jia Deng,Wei Dong,Richard Socher,Li-Jia Li,KaiLi,and Li Fei-Fei. ImageNet:一个大规模的分层图像数据库。CVPR,2009。[8] 丁宇航,范和合,徐明亮,杨毅。用于无监督人重新识别的自适应探索。arXiv预印本arXiv:1907.04194,2019。[9] 董轩逸和杨毅。在4个GPU小时内搜索一个强大的神经结构。在CVPR,2019年。[10] 范呵呵,梁铮,严成刚,杨毅。无人监管人员重新识别:聚类和微调。TOMCCAP,2018年。[11] Jiemin Fang , Yuzhu Sun , Qian Zhang , Yuan Li ,Wenyu Liu,and Xinggang Wang.密集连接的搜索空间,用于更灵活的神经架构搜索。arXiv预印本arXiv:1906.09607,2019。[12] Yang Fu,Yunchao Wei,Yuqian Zhou,Honghui Shi,Gao Huang,Xinchao Wang,Zhiqiang Yao,and ThomasHuang.用于人员重新识别的水平金字塔匹配在AAAI,2019年。[13] Kaiming He,Xiangyu Zhang,Shaoying Ren,and JianSun.用于图像识别的深度残差学习。在CVPR,2016年。[14] 亚历山大·赫尔曼斯、卢卡斯·拜尔和巴斯蒂安·莱布。为了防止三重丢失,进行人员重新鉴定。arXiv预印本arXiv:1703.07737,2017。[15] Houjing Huang,Dangwei Li,Zhang Zhang,XiaotangChen,and Kaiqi Huang.用于人员重新识别的不利遮挡样本在CVPR,2018年。[16] MahdiMKalayeh 、 EmrahBasa
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功