无监督的re-ID重新排序方法

92 浏览量更新于2023-10-16 收藏 1.26MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

1318用互逆编码重新识别人Zhun Zhong<$炜，Liang Zheng<$ $>，Donglin Cao<$炜，Shaozi Li<$炜†中国厦门大学认知科学系悉尼科技大学厦门大学福建省脑启发计算技术与应用重点实验室{zhunzhong007，liangzheng06}@ gmail.com{another，szlig}@ xmu.edu.cn摘要当考虑人的重新识别（重新ID）作为一个检索过程，重新排序是一个关键的步骤，以提高其准确性。然而，在re-ID社区，有限的努力一直致力于重新排名，特别是那些完全au-无监督的解决方案。在本文中，我们提出了一种-倒数编码方法来重新排序的re-ID结果-S.我们的假设是，如果一个画廊的图像是类似的探针在倒数最近的邻居，它更有可能是一个真正的匹配。具体地，给定图像，通过将其倒数最近邻编码成单个向量来计算倒数特征，该单个向量用于重新分类。在Jaccard距离下排序。最终距离计算为原始距离和Jaccard距离的组合。我们的重排序方法不需要任何人工交互或任何标记数据，因此它适用于大规模数据集。在大规模Market-1501、CUHK 03、MARS和PRW数据集上的实验证实了方法1的有效性.1. 介绍人员重新识别（re-ID）[52，4，24，32，28，30]是计算机视觉中的一项具有挑战性的任务。一般来说，re-ID可以被看作是一个检索问题。给定一个探针，我们希望在画廊中搜索跨相机模式下包含同一个人的图像。在获得初始排名列表之后，良好的实践包括添加重新排名步骤，期望相关图像将获得更高的排名。因此，在本文中，我们专注于重新排序的问题。重排序主要在通用实例检索中进行研究[6，15，35，36]。许多重新排序方法的主要优点是，它可以在不需要额外的训练样本的情况下实现，并且它可以被应用于*通讯作者1源代码可应要求提供。探头P1N1P2N2P3N3N4N5P4N6图1. 人员重新识别应用程序的最近邻域的图示。顶部：查询及其10个最近邻，其中P1-P4为正数，N1-N6为负数。机器人：每两列显示10个最近的邻居的相应的人.蓝色和绿色框分别对应于探针和阳性。我们可以观察到，探测者和阳性者是10个最近邻。应用于任何初始排名结果。重新排名的有效性在很大程度上取决于初始排名列表的质量。一个多人-我们的工作利用了在初始排序列表中排名靠前的图像（例如最近的邻居）之间的相似性关系[6，15，35，36，45，46]。一个基本假设是，如果返回的图像在探测器的最近邻居内排名，则它可能是可以用于随后重新排名的真匹配尽管如此，情况可能偏离最佳情况：假匹配很可能包含在探测器的最近邻中。例如图1、P1、P2、P3和P4是与探针的四个真实匹配，但它们都不包括在前4个等级中。我们观察到一些假匹配（N1- N6）获得高等级。因此，直接使用排名靠前的图像可能会在重新排名系统中引入噪声并损害最终结果。在文献[15，35]中，互反最近邻是解决上述问题的有效方法，即，1319探针对顶部图像的错误匹配的污染。当两个图像被调用时-倒数最近邻，它们都排名靠前-当另一个图像被用作探针时。因此，倒数最近邻作为两个图像是否真正匹配的更严格规则，没有在图1中，我们观察到探针是真实匹配图像的倒易邻居，但不是虚假匹配图像的倒易邻居。探针画廊火柴该观察识别了初始排名列表，以改善重新排名的结果。鉴于上述考虑，本文介绍了一种- 用于重新ID重新排序的倒数编码方法我们的方法包括三个步骤.首先，我们将权值倒数相邻集编码成向量，形成倒数特征.然后，两幅图像之间的Jaccard距离可以通过它们的互逆特征来计算其次，为了获得更鲁棒的互逆特征，我们开发了一种局部查询扩展方法，进一步提高了re-ID性能。最后，最终距离被计算为原始距离和Jaccard距离的加权聚合。它随后用于获取重新排序列表。所提出的方法的框架如图所示二、总之，本文的贡献是：● 我们提出了一个互逆特征编码成一个重新排序过程可以通过向量比较容易地执行● 我们的方法不需要任何人工交互或注释数据，并且可以应用于任何人re-ID排名以自动和无监督的方式产生。● 该方法在Market-1501、CUHK 03、MARS和PRW等数据集上有效地提高了个体识别性能。特别是最大，我们实现了国家的最先进的准确性市场-1501在秩-1和mAP。2. 相关工作我们建议感兴趣的读者参考[4，52]，以了解有关人员重新识别（re-ID）的详细评论。在这里，我们专注于研究，旨在重新排名的对象检索方法，特别是重新ID。重新排序对象检索。重新排序方法已被成功研究，以提高对象检索的准确性[53]。许多作品利用最近邻来探索相似性关系，以解决重新排序的问题。Chum等人 [6]提出了平均查询扩展（AQE）方法，其中通过对顶部返回结果中的向量进行平均来获得新的查询向量，并用于重新查询数据库。利用负样本远离初步排名：AP=9.05%拟议排名：AP=51.98%图2. 重新识别身分的建议重新评级架构。给定一个探针和一个图库，提取每个人的外观然后计算每对探测人和走廊人的原始距离和Jaccard距离最后的dis-将排序优先级计算为和的组合，其用于获得所建议的排序列表。查询图像，Arandjelovic和Zisserman [1]开发了判别查询扩展（DQE），使用线性SVM来获得权重向量。采用距离决策边界的距离来修正初始排序列表。Shen等人。 [36]使用初始排名列表的k-最近邻作为新查询来产生新的排名列表。每个图像的新分数根据其在生成的排名列表中的位置计算最近，s-解析上下文激活（SCA）[2]提出将邻居集编码为向量，并指示类似的样本-广义Jaccard距离为了防止对顶部图像的错误匹配的污染，在[15，35]中采用了-倒数最近邻。在[15]，上下文相异度量（CDM）是亲，提出通过迭代正则化每个点到其邻域的平均距离来细化相似性。Qin等人 [35]正式提出了互反最近邻的概念.k-倒数最近邻是con-被认为是高度相关的候选者，并用于构建闭集，以重新排序数据集的其余部分。我们的工作在几个方面与这两部作品有所不同。我们不对称-度量最近邻关系以细化相似度，如[15]，或直接将倒数最近邻视为排名最高的样本，如[35]。相反，我们计算一个新的距离两个图像之间的比较他们的倒数最近的邻居。重新排序以重新识别。大多数现有的人员重新识别方法主要集中在特征表示[43，13，24，50，22]或度量学习[24，18，10，33、47]。最近，一些研究人员[11，34，29，25，51，21，12，20，44，46]已经注意到在re-ID社区中基于重新排名的方法。不同于[25，40]和[3]，需要人工交互或标签监督，我们专注于自动和无监督的解决方案。Li等人。 [21]通过分析外观特征ݔݔଵ马哈拉诺比斯原度量距离`最终距离ݔ聚集`k-倒易特征ࣰ◌ࣰ◌ଵࣰ◌Jaccard度规`כJaccard距离特征提取距离计算聚集样品. ... ..1320222 32∗1 2+1个每对图像的近邻的相关信息和直接信息。在[12]中，通过联合考虑排名列表中的内容和上下文信息来学习无监督重新排名模型，其有效地去除了模糊样本以提高re-ID的性能。Leng等人。[20]提出了一种双向排名方法，用于使用计算为内容和上下文相似性融合的新相似度来修改初始排名列表。最近，不同基线方法的公共最近邻被用于重新排序任务[44，46]。 Ye et al.[44]将全局和局部特征的公共最近邻组合为新的查询，并通过聚合新的排名列表来修改初始排名列表全球和本地的特点。在[46]中，利用最近邻集来计算相似性和相异性从不同的基线方法，然后进行聚合的继续推进上述方法，重新排序承诺，为未来做出贡献发现来自最近邻的更多信息。然而，使用最近邻直接实现重新排序可能会限制整体性能，经常包括错误的匹配。为了解决这个问题，在本文中，我们调查的重要性，互惠邻居的人重新身份证，因此设计了一个简单而有效的重新排名方法。3. 该方法3.1. 问题定义给定一个探针人和画廊设置与图像图3. k-reciprocal neighbors展开过程的示例。将与C相似的正人G添加到正人G（，20）中。其中，n·n表示集合中的候选者的数量的- 倒数最近邻函数可以定义为，<$（，）={<$（∈（，））<$（∈（，））}（3）根据前面的描述，n-倒数最近邻比n-最近邻与探测的关系更密切然而，由于照明的变化，位置-ES、视图和遮挡，可以从最近邻中排除正图像，并且随后不将其包括在倒数最近邻中。为了解决这个问题，我们根据以下条件，将每个候选项的1-倒数最近邻递增地添加到更鲁棒的集合中ℛ∗(,)← ℛ(,)∪ ℛ(,1)....={1，2，. 我们之间的距离人和可以测量的马氏距离，（，）=（-）M（-）（1）S.T. . （，）2002年。（1）. 、∈（四）通过这种操作，我们可以将更积极的添加到（，）中其中和表示探头的外观特征和g，R，V，并且M是一个半定矩阵。初始化排序列表t（，）={0，0，. 0}可以更类似于候选人的样本，而不是探测器与[35]相比，这对于包含过多的阴性样本更为严格。在图3中，我们举一个膨胀过程的例子。最初硬正G在图10（，20）中被遗漏。有趣的是，根据成对原始距离be-当e（，0）<（，0）时，可以用tweenprobeandgalleryy表示。我们的目标是重新排名，使更多的积极样本排名在列表中的顶部，从而提高性能，人员重新识别（re-ID）。3.2. - 倒数最近邻在[35]之后，我们将（，）定义为探针的最近邻（即排名列表的顶部样本）：（，）={0，0，.，0}，（，）=（2）G包含在Δ G（，10）中，这是使正G恢复的有益信息。然后，我们可以使用Eq。4把G加到G（，20）中。因此，在扩增过程后，可以将更多的阳性样本加入到扩增产物中（，）。D-与[35]不同，我们不直接将候选图像（，）中的候选图像作为排名靠前的图像。相反，我们考虑将探针（，）作为上下文知识来重新计算探针和画廊之间的距离。3.3. Jaccard距离在本小节中，我们重新计算两两距离在探测器和画廊之间，1 2Q A B C D E F࣬◌ሺǡʹͲሻራ࣬◌ሺǡͳͲሻB G QQ A B C D E F G࣬◌ሺǡͳͲሻ࣬◌ሺǡʹͲሻכ࣬◌ሺǡʹͲሻ1321、、、- 倒数最近邻集。如前所述[2] [46]，我们认为如果两个图像相似，则它们的k-倒数最近邻集重叠，即。，有一些重复样本。重复样本越多，两幅图像越相似。的新距离探头应与探头更相似。因此，我们根据原始距离重新分配权重，探针和它的邻居，我们重新定义方程。6通过成对距离的高斯核，{之间和可以通过Jaccard度量计算，，=e-（，）如果∈（，）（七）他们的-倒数集为：0否则。∣ℛ∗(,)∩ℛ ∗(,)∣（，）=1-（，）（，）（5）其中，n·n表示集合中的候选者的数量。我们采用Jaccard距离来命名这个新的距离。虽然上述方法可以捕获相似性关系，通过这种方式，硬加权（0或1）被转换为软加权，较近的邻居分配较大的权重，而较远的邻居分配较小的权重。基于上述定义，交集和并集中的候选数可以计算为：在两幅图像之间，仍然存在着三个明显的短板：∣ℛ∗(,)∩ℛ ∗(,)∣=∥min(,)∥∣ℛ∗(,)∪ℛ ∗(,)∣=∥max(,)∥（八）（九）● 在许多情况下，求两个集合 S_n （，）和 D_n（，）的交集和并集是非常耗时的需要为所有图像对计算Jaccard距离。另一种方法是对邻近的编码-其中min和max操作两个输入向量的基于元素的最小化和最大化。·因此，我们可以将Jaccard距离改写为等式。5作为∑min（，）bor设置成一个更容易但等效的向量，减少（，）=1-∑=1（十）max（，）计算复杂度很大，同时保持-=1在邻居集中的原始结构● 距离计算方法对所有邻居的权重相等，从而产生简单但不具有区分性的邻居集。事实上，离探测器更近的邻居更有可能是真阳性。因此，重新计算权重是有说服力和合理性的基于原始距离，并将较大权重分配给较近的样本。通过公式变换，从Eq. 5、Eq 10，我们成功地将集合比较问题转化为纯向量计算，这在实际中要容易得多。3.4. 本地查询扩展模拟的想法，从同一类的图像可能会共享相似的功能，我们使用的探测器的最近邻居来实现本地查询扩展。本地查询扩展定义为● 在尝试将上下文信息纳入帐户时，测量两个人之间的相似性，因为不可避免的差异使其难以区分1=（，）∑∈（，）（十一）足够的上下文信息。因此，对原始距离和Jaccard距离进行迭代对于鲁棒距离变得受[2]的启发，提出了互逆特征来解决前两个缺点，- 被设置为向量的倒数最近邻=[，1，，2，...，，]，其中，初始地通过二进制指示函数将d定义为{1if∈N（，）因此，互逆特征被- 探测器的最近邻居。请注意，我们实现了这个查询的扩展两个H eprobe和galleries。由于在最近的邻居中会有噪声，我们将本地查询扩展中使用的（，）的大小限制为较小的为了区分矩阵的大小，使用等式中的d。 7、Eq. 11，分别将前者表示为1，将后者表示为2，其中1>2。3.5. 最终距离，=0否则。（六）在本小节中，我们重点讨论Eq的第三个缺点。五、虽然大多数现有的重新排序方法忽略了以这种方式，互逆邻居集合可以被表示为：ed作为多维向量，向量的每一项指示对应图像是否包含在pixel（，）中。然而，该函数仍然认为每个相邻者是平等的。直觉上，邻居谁是更接近111322原始距离在重新排序中的重要性，我们将原始距离和Jaccard距离联合起来修改初始排序列表，最终距离定义为（，）=（1-）（，） +（，）（12）1323其中 ∈[0 ， 1] 表示惩罚因子，它惩罚远离探针的Galeries。当=0时，仅考虑k倒数距离。相反，当= 1时，只考虑原始距离。的影响在第4节中讨论。最后，可以通过对最终距离进行升序排序来获得修改后的排序列表Ranking（，）3.6. 复杂性分析在所提出的方法中，大部分的计算成本集中在所有图库对的成对距离计算上。假设图库集的大小为，距离度量和秩所需的计算复杂度为：在g过程中，s是（ 2）和d是（ 2），分别对应。然而，在实际应用中，我们可以计算成对距离，并提前离线获得画廊的排名列表。因此，如果有一个新的探测器，我们只需要以计算复杂度（）计算和图库之间的成对距离，并以计算复杂度（）对所有最终距离进行排名。4. 实验4.1. 数据集和设置数据集因为我们的重新排序方法是基于两个人之间相似邻居的比较，我们对四个大规模的人重新识别（re-ID）基准数据集进行了实验，这些数据集包含画廊中每个探针的多个阳性样本：包括两个基于图像的数据集，Market-1501 [50]，CUHK 03[23]、基于视频的数据集MARS [49]和端到端数据集PRW [54]（概述见表1）。Market-1501是目前最大的基于图像的re-ID基准数据集。它包含32，668个标记的绑定框，其中包含从6个不同视点捕获的1，501个身份使用可变形零件模型（Deformable Part Model，简称DEEP）[9]检测边界框。数据集分为两部分：12，936张图像，751个身份用于训练，19，732张图像，750个身份用于测试。在测试中，使用3，368张手绘图像（750个身份）作为探针集，以识别测试集上的正确身份。我们报告了这个数据集的单查询评估结果CUHK03[23]包含14，096张图像，包含1，467个身份。每个身份都是从中大校园的两个摄像头拍摄的，每个摄像头平均有4.8张图像。数据集提供手动标记的边界框和DPM检测的边界框。在本文中，“标记”和“检测”数据的实验结果MARS[49]是迄今为止最大的基于视频的re-ID基准数据集，包含1，261个身份和大约20，000个视频序列。这些序列是从6个不同的相机收集的，每个身份有13.2个序列。表1.在我们的实验中使用的数据集的细节数据集编号#盒子#box/ID#凸轮市场-1501 [50]1,50132,64319.96香港中文大学03[23]1,46714,0969.72火星[49]1,2611,067,51613.26PRW [54]93234,30436.86平均的序列。每个序列都是自动获得的行人探测器和GMMCP[7]追踪者。此外，该数据集还包含3，248个分心物序列。数据集被固定地分成训练集和测试集，分别具有631和630个标识。在测试中，选择了2,009个探头进行查询。PRW[54]是一个端到端的大规模数据集。它由11，816帧932个身份组成，这些身份是从六个不同的摄像头捕获的从这些帧中生成总共43，110个带注释的人物边界框。给定查询边界框，数据集旨在首先对原始帧执行足检测以生成图库，并从图库中识别正确的边界框。该数据集被划分为具有482个身份的5，704帧的训练集和具有450个身份的6，112帧的测试集。在测试中，选择了450个身份的2，057个查询图像进行评估。检测到的边界框被认为是正确的，如果它的IoU值与地面真理是0.5以上。评估指标我们使用两个评估指标来评估re-ID方法在所有数据集上的性能S.第一个是累积匹配特性（CMC）。考虑到重新ID作为一个排名问题，我们报告的累积匹配精度在秩1。另一个是考虑re-ID作为对象检索问题的平均平均精度（mAP），如[50]所述。特征表示局部最大发生率（LOMO）特征用于表示人的外观[24]。它是强大的查看变化和照明变化。此外，还使用了[54]中提出的ID判别Em bedding（IDE）特征。IDE提取器在分类模型上进行了有效的训练，包括CaffeNet [19]和ResNet-50 [14]。它为每个图像生成一个1，024-dim（或2，048-dim）向量，这在大规模re-ID数据集中是有效的。为了描述方便，我们将在CaffeNet 和 ResNet-50 上训练的 IDE 分别扩展为 IDE（C）和IDE（R）我们使用这两种方法作为我们的re-ID框架的基线4.2. 市场实验我们首先在最大的基于图像的re-ID数据集上评估我们的方法在这个数据集中，除了使用LOMO和IDE功能外，我们还使用BOW [50]功能。我们在CaffeNet [19]和ResNet-50 [14]上训练IDE功能。我们将1设置为20，2设置为6，然后设置为0.3。使用我们的方法的各种方法之间的结果示于表2中。我们的方法始终如一地提高了rank-1的准确性和mAP1324表2. 在Market-1501数据集上比较各种方法与我们的重新排名方法。方法秩1地图BOW [50]35.8414.75BOW +我们39.8519.90弓+吻42.9019.41BOW + KISSME +我们的44.7725.64BOW + XQDA41.3919.72BOW + XQDA +我们的42.6124.98LOMO + KISSME41.1219.02LOMO + KISSME + Ours45.2228.44[24]第二十四话43.5622.44LOMO + XQDA +我们的48.3432.21[54]第五十四话55.8731.34IDE（C）+ AQE [6]57.6935.25IDE（C）+ CDM [15]58.0234.54IDE（C）+Ours58.7942.06IDE（C）+XQDA57.7235.95IDE（C）+ XQDA + Ours61.2546.79IDE（C）+KISSME58.6135.40IDE（C）+ KISSME + Ours61.8246.81[54]第五十四话72.5446.00IDE（R）+ AQE [6]73.2050.14IDE（R）+ CDM [15]73.6649.53IDE（R）+Ours74.8559.87IDE（R）+XQDA71.4148.89IDE（R）+ XQDA + Ours75.1461.87IDE（R）+KISSME73.6049.05IDE（R）+ KISSME +Ours77.1163.63所有功能，即使是在强大的ResNet-50模型上训练的IDE（R）我们的方法获得3。06%的rank-1准确性和显着改善13。IDE（R）的mAP改善99%。此外，实验KISSME [18]和XQDA [24]验证了我们的方法在不同距离度量上的有效性与两种流行的重排序方法，平均查询扩展（AQE）[6]和上下文离散性度量（CDM）[15]相比，我们的方法在rank-1准确率和mAP方面都优于它们。许多现有的人员重新身份的重新排序方法是用于单次设置或需要人工交互[25，40]。因此，这些方法与我们的方法没有直接可比性。表3比较了我们的最佳方法IDE（R）+KISSME+我们的方法与其他最先进方法的性能我们最好的方法令人印象深刻地优于以前的工作，并实现了大幅度的进步相比，国家的最先进的结果，在等级1的准确性，特别是在mAP。4.3. CUHK03实验根据[23]中的单次设置协议，我们将数据集分割为包含1，160个身份的训练集测试过程用20个随机分裂重复我们将1设为7，2设为3，然后设为0.85。单次激发设置的结果如表4所示。正如我们所看到的，在使用IDE功能时，重新排序结果几乎等同于原始结果。它表3. 比较我们的方法与Market-1501数据集上的最新技术。方法秩1地图SDALF [8]20.538.20[48]第四十八话33.5413.54BOW [50]34.4014.09[42]第四十二话37.2118.57dCNN [37]39.4019.60[24]第二十四话43.7922.22[27]第二十七话45.10-WARCA [16]45.16-MBCNN [38]45.5826.11HistLBP+kLFDA [17]46.50-TMA [31]47.9222.31DLDA [41]48.1529.94加拿大[26]48.2424.43SCSP [5]51.9026.35DNS [47]61.0235.68[39]第三十九话65.8839.55IDE（R）+ KISSME +Ours77.1163.63表4. 比较各种方法与我们的重新排序方法在CUHK03数据集下的单次设置。方法标记检测秩1地图秩1地图[24]第二十四话49.756.444.651.5LOMO + XQDA +我们的50.056.845.952.6[54]第五十四话57.063.154.160.4IDE（C）+Ours57.263.254.260.5IDE（C）+XQDA61.767.658.964.9IDE（C）+ XQDA +Ours61.667.658.564.7我们的方法行不通是合理的。由于图库中的每个身份只有一个正面，因此我们的方法无法获得足够的上下文信息。即便如此，我们的方法获得了近1%的改善rank-1的准确性和mAP，同时应用LOMO功能的“标记”和“检测”设置，除了LOMO + XQDA在“标记”设置。实验表明，在单次拍摄的情况下，该方法对结果没有损害，并有机会提高性能。除了之前的评价方法外，我们还报告了使用与Market-1501类似的新培训/测试方案的结果。新协议将数据集分为训练集和测试集，分别由767个身份和700个身份组成在测试中，我们从每个相机中随机选择一个图像作为每个身份的查询，并使用其余的图像来构建图库集。新协议具有两个优点：1）对于每个身份，在图库中存在多个地面实况。这更符合实际应用场景。2)将数据集一次性划分为训练集和测试集有助于避免多次重复训练和测试。划分的训练/测试集和评估代码在我们的源代码中可用我们将1设置为20，2设置为6，然后设置为0.3。表5中的结果表明，在所有情况下，我们的方法显着提高了rank-1的准确性，1325表5. 在新的训练/测试协议下，各种方法与我们在CUHK 03数据集上的重新排序方法之间的比较。方法标记检测秩1地图秩1地图[24]第二十四话14.813.612.811.5LOMO + XQDA +我们的19.120.816.617.8[54]第五十四话15.614.915.114.2IDE（C）+Ours19.121.319.320.6IDE（C）+XQDA21.920.021.119.0IDE（C）+ XQDA + Ours25.927.826.426.9[54]第五十四话22.221.021.319.7IDE（R）+Ours26.628.924.927.3IDE（R）+XQDA32.029.631.128.2IDE（R）+ XQDA +Ours38.140.334.737.4地图特别是对于IDE（R）+XQDA，我们的方法在rank-1准确度上提高了6.1%，在mAP上提高了10.7%4.4. 火星上的实验我们还评估了我们的方法基于视频的数据集。在这个数据集上，我们采用两个特征作为基线方法，LOMO和IDE。对于每个序列，我们首先为每个图像提取特征，并使用最大池化来组合al-l特征转换为固定长度的向量。我们在这个数据集中将1设置为20，2设置为6，并我们的方法在不同特征和指标上的性能报告在Ta中表6.正如我们所看到的，我们的重新排序方法一致地提高了两个不同特征的rank-1准确度和mAP。与平均查询扩展（AQE）[6]和上下文相异度（CDM）的[15]表明我们的方法在rank-1精度和mAP方面都优于它们。此外，我们的方法甚至可以在所有情况下提高秩1精度和mAP，同时使用区分性度量。特别是，我们的方法将 rank-1准确率从70.51%提高到 73.94%，并且mAP对于IDE（R）+XQDA，从55.12%到68.45%实验-谈话结果表明，我们重新排序方法也对基于视频重新识别问题有效我们相信，通过将更复杂的特征模型与我们的方法相结合，这个问题的结果将得到进一步的改善4.5. PRW实验我们还在端到端的re-ID数据集上评估了我们的方法。该数据集比基于图像和基于视频的数据集更具挑战性，因为它需要从原始图像中检测人并从检测到的图库中识别正确的人。在[54]之后，我们首先使用code.js来检测大型原始图像上的人的候选边界框，然后对检测到的边界框进行查询我们使用LOMO和IDE为每个边界提取特征框，并将这两种方法作为基线。我们设置1到20，2到6，和0.3。实验结果表明，表6. 在MARS数据集上比较各种方法与我们的重新排序方法。方法秩1地图LOMO + KISSME30.8615.36LOMO + KISSME + Ours31.3122.38[24]第二十四话31.8217.00LOMO + XQDA +我们的33.9923.20[54]第五十四话61.7241.17IDE（C）+ AQE [6]61.8347.02IDE（C）+ CDM [15]62.0544.23IDE（C）+Ours62.7851.47IDE（C）+KISSME65.2544.83IDE（C）+ KISSME +Ours66.8756.18IDE（C）+XQDA65.0546.87IDE（C）+ XQDA + Ours67.7857.98[54]第五十四话62.7344.07IDE（R）+ AQE [6]63.7449.14IDE（R）+ CDM [15]64.1147.68IDE（R）+Ours65.6157.94IDE（R）+KISSME70.3553.27IDE（R）+ KISSME +Ours72.3267.29IDE（R）+XQDA70.5155.12IDE（R）+ XQDA + Ours73.9468.45表7. 在PRW数据集上比较各种方法与我们的重新排序方法。方法秩1地图[24]第二十四话34.9113.43LOMO + XQDA +我们的37.1419.22[54]第五十四话51.0325.09IDE（C）+Ours52.5431.51在表7中。可以看出，我们的方法一致地提高了LOMO和IDE特征的rank-1准确率和mAP，证明了我们的方法在端到端重新识别任务上是有效的。4.6. 参数分析在这一小节中，我们的方法的参数进行了分析. 基线方法是LOMO [24]和IDE[54]在CaffeNet上训练。我们评估1的影响，2，以及Market-1501数据集上的rank-1准确度和mAP为了进行实验分析，我们随机选择了-将原始训练集拆分为训练集和验证集，分别具有425个和200个标识。图图4示出了k-倒数邻居集的大小对秩1准确度和mAP的影响可以看出，我们的方法始终优于基线，rank-1准确度和mAP具有不同的1值。mAP首先随着1的增长而增加，然后在1超过阈值后开始缓慢下降类似地，随着1的增长，rank-1精度首先随着波动而上升;在到达1=20附近的最佳点之后，它开始下降。对于太大的值1，将有更多的错误匹配包括在k-倒数集合中，导致业绩下滑1326等级-1（LOMO）6664626058mAP（LOMO）55504540等级-1（IDE）818079787776mAP（IDE）70656055等级-1（LOMO）6664626058mAP（LOMO）55504540等级-1（IDE）818079787776mAP（IDE）706560555625 10152025303540K1LOMO+XQDAIDE3525 10152025303540K1LOMO+XQDA+我们的IDE+我们的7525101520253035 40K1LOMO+KISSMEIDE+XQDA5025101520253035 40K1LOMO+KISSME+我们的IDE+XQDA+我们的5600.20.40.60.81LOMO+XQDAIDE3500.20.40.60.81LOMO+XQDA+我们的IDE+我们的7500.20.40.60.81LOMO+KISSMEIDE+XQDA5000.20.40.60.81LOMO+KISSME+我们的IDE+XQDA+我们的图4.参数1对Market-1501数据集上re-ID性能的影响我们把2固定在6和0.3。图6. 参数对Market-1501数据集上re-ID性能的影响。我们把1固定在20，2固定在6。等级-1（LOMO）6664626058561510 15 20 25 30 35 40K2LOMO+XQDAIDEmAP（LOMO）55504540351510 15 20 25 30 35 40K2LOMO+XQDA+我们的IDE+我们的等级-1（IDE）8280787674727015101520253035 40K2LOMO+KISSMEIDE+XQDAmAP（IDE）706560555015101520253035 40K2LOMO+KISSME+我们的IDE+XQDA+我们的IDEIDE+我们的图5.参数2对Market-1501数据集上re-ID性能的影响我们把1固定在20和0.3。2的影响如图所示五、当2等于1时，不考虑本地查询扩展。显然，在合理的范围内，性能随着2的请注意，为2分配一个太大的值会降低性能。因为它可能导致指数-在局部查询扩展中包含错误匹配，这无疑会损害特征，从而影响性能。事实上，局部查询扩展是非常有益的。当将适当的值设置为2时，参数的影响如图所示六、请注意，当设置为0时，我们仅将Jaccard距离视为最终距离;相反，当等于1时，Jaccard距离被忽略，结果正好是基础-使用纯原始距离获得的直线结果。可以观察到，当仅考虑Jaccard距离时，我们的方法始终优于基线。这说明了所提出的Jaccard距离对于重新排序是有效的此外，如果同时考虑两者原始距离和Jaccard距离的比较表明，当的值在0.3左右时，性能得到进一步的改善，表明原始距离对于重新排序也是在图7中，示出了四个示例结果。所提出的方法，IDE + Ours，有效地排名更多的真正的人在排名列表的顶部，在IDE的排名列表中错过。5. 结论在本文中，我们解决了重新排序问题的个人重新识别（重新ID）。我们提出了一种k-倒数特征，通过将k-倒数最近邻编码到单个向量中，从而可以容易地进行重新排序过程。通过向量比较来执行。为了从相似样本中捕获相似关系，局部扩展IDEIDE+我们的IDEIDE+我们的IDEIDE+我们的图7. Market-1501数据集上四个探测器的示例结果。对于每个探针，第一行和第二行分别对应于IDE和IDE + Ours产生的排名结果绿框包围的人表示与探头相同的人。查询被提出以获得更鲁棒的互逆特征。最后的距离基于o-原始距离和Jaccard距离在几个大规模数据集上有效地值得一提的是，我们的方法是全自动和无监督的，可以很容易地实现任何排名结果。6. 确认我们感谢李文静和雷明义的有益讨论和鼓励。本研究得到了国家自然科学基金（ No. 61572409 号，61402386&号福建省2011年中医药健康管理协同创新中心、中国乌龙茶产业协同创新中心探针探针探针探针等级-1准确度（%）等级-1准确度（%）地图地图等级-1准确度（%）等级-1准确度（%）地图地图Rank−1准确度（%）地图Rank−1准确度（%）地图1327引用[1] R. Arandjelovic和A.齐瑟曼。每个人都应该知道的三件事，以提高对象检索。CVPR，2012。2[2] S. Bai和X.柏稀疏的上下文激活有效的视觉重新排名。IEEE TIP，2016年。二、四[3] S. Bai，X.Bai和Q.田监督平滑流形上的可扩展人员再识别在CVPR，2017年。2[4] A. Bedagkar-Gala和S. K. Shah.对个人重新识别的方法和趋势的调查。图像和视觉计算，2014年。一、二[5] D. Chen，Z.袁湾，澳-地Chen和N.郑具有空间约束的相似性学习用于人的重新识别。在CVPR，2016年。6[6] O. Chum，J. Philbin，J. Sivic，M. Isard和A.齐瑟曼。总召回：用生成特征模型进行对象检索的自动查询扩展。载于ICCV，2007年。一、二、六、七[7] A. 德汉，S.Modiri Assari和M.Shah. GMMCP跟踪器：多目标跟踪的全局最优广义最大多团问题。CVPR，2015。5[8] M. 法伦泽纳，L. 巴扎尼，A. 佩里娜，V.Murino，以及M. 克里斯塔尼通过局部特征的累积进行人员重新识别CVPR，2010。6[9] P. F. 费尔岑斯瓦尔布河B. Girshick，D.McAllester和D.拉玛南。用有区别地训练的基于部分的模型进行目标检测。IEEE TPAMI，2010。5[10] J. Garc'ıa，N. Martinel，A.加德尔岛干得好G L. Foresti和C.米凯洛尼基于方向驱动分类器的特征距离VCIP，2016年。2[11] J. 加西亚，加 - 地 Martinel ， A. 加德尔岛干得好 GL.Foresti，以及C.米凯洛尼判别式上下文信息分析用于排名后的人员重新识别。TIP，2017年。2[12] J. Garcia，N.马丁内尔角Micheloni和A.加德尔通过判别式上下文信息分析的人再识别排名优化。在ICCV，2015年。二、三[13] D. Gray和H.涛. 具有局部特征集合的视点不变行人识别ECCV，2008年。2[14] K.他，X。Zhang，S. Ren和J. Sun.用于图像识别的深度残差学习。在CVPR，2016年。5[15] H. Jegou，H. Harzallah和C.施密特一个准确和有效的图像搜索的上下文不相似性度量CVPR，2007。一、二、六、七[16] C. Jose和F.弗勒特通过加权近似秩分量分析的可扩展度量学习在ECCV，2016年。6[17] S. Karanam，M. Gou，Z.古，英-地Wu，中国茶条A.拉泰博拉斯岛Camps和R.J. 拉德克人员再认定的综合评价和基准：功能、指标

下载后可阅读完整内容，剩余1页未读，立即下载