开放世界动态摄像机网络中的人的重新识别方法

39 浏览量更新于2023-10-16 收藏 939KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

1开放世界动态摄像机网络Rameswar Panda 1， AmranBhuiyan 2，Amit K. Roy-Chowdhury1 1 ECE2模式分析与计算机视觉系（PAVIS）UC Riverside Istituto Italiano di Tecnologia，意大利{rpand002 @，amitrc @ ece. ucr.edu{amran.bhuiyan，vittorio.murino}@ iit.it摘要人的重新识别是计算机视觉中一个开放的、具有挑战性的现有的方法集中在设计最佳特征表示或在静态设置中学习最佳匹配度量，其中网络中的摄像机数量是固定的。大多数方法都忽略了重新识别问题的动态和开放世界性质，其中新的摄像机可能临时插入现有系统训练图像（，）（，）没有标签模型训练C1C2C3新引进的相机我们怎样才能以最小的努力介绍新相机呢？现有摄像机网络Re-ID模型图1. 考虑具有两个摄像机C1和C2的现有网络。C2，其中我们使用成对训练获取更多信息为了解决这样一个新的和非常实际的问题，我们提出了一个无监督的适应计划，在动态摄像机网络中重新识别模型首先，我们制定了一个领域的自主重新识别方法的基础上测地线流内核，可以有效地找到最好的源相机（已经安装），以适应新引入的目标相机，而不需要一个非常昂贵的训练阶段。其次，我们引入了一种用于重新识别的传递性推理算法，该算法可以利用来自最佳源相机的信息来提高多个相机的网络中的其他相机对的准确性。在四个基准数据集上的广泛实验表明，所提出的方法显着优于最先进的基于无监督学习的替代方案，同时计算效率极高。1. 介绍人员重新识别（re-id）解决了多摄像机系统中跨非重叠视图匹配人员的问题，在过去几年中引起了大量关注[25，59，74]。在开发寻求最佳特征表示（例如，[64，39，3，42]）或提议为了学习最佳匹配度量（例如， [37 、 52 、 37 、67]）。虽然它们在COM上获得了合理的性能，ABRP和AB应被视为联合第一作者†这项工作是在AB是加州大学河滨分校两个摄像头的数据在运行阶段，A引入新的摄像机C3以覆盖现有2个摄像机不能很好地覆盖的特定区域。现有的方法大多没有考虑re-id模型的这种动态特性相比之下，我们建议以无监督的方式调整现有的re-id模型：什么是与新相机配对的最佳源相机，以及我们如何利用最佳源相机来提高其他相机之间的匹配精度。仅使用的基准数据集（例如，[51，16，12，73]），我们认为这些方法还没有考虑一个基本的相关问题：给定一个摄像机网络，其中摄像机间的转换/距离度量已经在密集训练阶段学习，我们如何以最小的额外努力将新摄像机集成到已安装的系统中？这是在现实的开放世界重新识别场景中要解决的一个重要问题，其中新的相机可以临时插入到现有系统中以获得额外的信息。为了说明这样的问题，让我们考虑具有N个相机的场景，我们已经学习了最佳的成对距离度量，因此为所有相机对提供高re-id准确度。然而，在特定事件期间，可能会临时引入新摄像机以覆盖某个特定事件。没有被现有的N个摄像机网络很好地覆盖的封闭区域（见图1）。1为例）。尽管世界是动态的和开放的，但几乎所有的重新识别工作都假设重新识别问题是静态的和封闭的世界模型，其中相机的数量是固定的。网络对于一个新推出的相机，传统的重新-70547055ID方法将尝试使用昂贵的训练阶段来重新学习相机间变换/距离度量。这是不切实际的，因为在新相机中标记数据，然后学习与其他相机的转换是耗时的，并且破坏了临时引入额外相机的整个目的。因此，迫切需要开发可以在这种动态相机网络中工作的用于重新识别的无监督领域自适应[15，32]最近在许多经典视觉问题中取得了成功，例如物体识别[24，56，19]和具有多个类别或领域的活动分类[48，69主要目标是将学习系统从源域扩展到目标域，而不需要目标域中的禁止量的训练数据。考虑到一个新引入的摄像机作为目标域，我们提出了一个重要的问题，在本文中：可以利用无监督域自适应在动态摄像机网络的重新识别？与经典的视觉问题不同，例如，对象识别[56]，用于RE-ID的域适配具有附加的挑战。域适应的一个核心问题是从哪个源转移。当只有一个与感兴趣的任务高度相关的可用信息源时，则域适应比在更一般和现实的情况下简单得多，在更一般和现实的情况下，存在相关性变化很大的多个动态网络中的重新识别属于后一种更困难的情况。具体来说，给定多个源摄像机（已经安装）和一个目标摄像机（新引入），我们如何选择最佳的源摄像机与目标摄像机配对？这个问题可以很容易地扩展到多个额外的相机被引入。而且，一旦识别出最佳源相机，我们如何利用此信息来提高其他相机对的重新识别精度？例如，让我们考虑C1是图1中新引入的相机C3的最佳源相机。一旦获得了C1和C3之间的成对距离度量，我们是否可以利用此信息来提高（C2这是一个特别重要的问题，因为它将允许我们现在将新插入的目标摄像机C3中的数据与所有先前安装的摄像机进行匹配。1.1. 解决方案战略为了解决第一个挑战，我们提出了一种基于测地线流核[18，19]的无监督重新识别方法，该方法可以有效地找到最佳源相机以适应目标相机。如果有摄像头对，每个摄像头-由N中的1个源摄像机和一个目标摄像机组成，我们首先在子空间上计算一个核，两个摄像机的数据，然后使用它来找到源摄像机和目标摄像机之间的内核距离。然后，我们根据平均距离对源摄像机进行排名，并选择距离最低的摄像机作为最佳源摄像机。与目标相机配对。这是直观的，因为最接近新引入的相机的相机将在目标相机上给出最佳的re-id性能，因此更有可能比其他相机更好地适应。换句话说，相对于目标相机具有最低距离的源相机指示两个传感器可以彼此相似并且它们的特征可以类似地分布。请注意，我们仅使用来自源相机的标记数据来学习内核。为了解决第二个挑战，我们引入了一种用于重新识别的过渡推理算法，该算法可以利用来自最佳源相机的信息来提高其他相机对的准确性。关于图1中的示例。1，其中源摄像机C1与目标摄像机C3最佳匹配，我们提出的传递算法通过边缘化最佳源摄像机C1中可能出现的域来建立摄像机对（C2-C3）之间的路径。具体来说，C1在C2和C3之间起着“连接器”的作用实验表明，该方法通过提高摄像机对之间的匹配性能，同时利用最佳源摄像机的边信息，提高了网络的整体re-id精度1.2. 贡献在本文中，我们解决了一个新颖且非常实用的问题-如何将一个或多个摄像头临时添加到现有网络并利用其进行重新识别，而无需添加非常昂贵的训练阶段。据我们所知，这是第一次在重新识别研究中解决为了解决这一问题，我们做出了以下贡献：(i)一种基于测地线流核的无监督重新识别方法，可以在动态摄像机网络中找到最佳源摄像机以适应新引入的目标摄像机;（ii）传递性推理算法，用于利用来自最佳源相机的边信息来提高跨其他相机对的匹配精度;(iii) 严格的实验验证了我们的方法的优势，现有的替代品在多个基准数据集与可变数量的相机。2. 相关工作人们从不同的角度研究了人的重新识别（见[74]最近的一项调查）。这里，我们重点介绍一些与我们工作密切相关的代表性方法监督再鉴定。大多数现有的人重新识别技术是基于监督学习。这些方法要么寻求最佳特征表示[64，39，3，49，9，55，6，5]，要么学习判别式方法，rics/dictionaries [37，76，53，36，38，58，23，26，72]，其产生两个相机之间或图库与探针图像之间的最佳匹配分数最近，深度学习方法已被应用于人员重新识别[70，68，65，10，63，43]。结合特征表示和met-7056我我使用端到端深度神经网络的ric学习也是重新识别的最新趋势[1，35，66]。考虑到中等大小的相机网络可以容易地具有大量相机，这些监督的re-id模型将需要大量的标记数据，这在现实世界的设置中是难以收集的。为了绕过监督re-id模型中训练数据的繁琐标记，最近人们对使用主动学习进行重新识别感兴趣，该主动学习智能地选择未标记的示例供专家以交互方式标记[40，13，50，60，14]。然而，所有这些方法都考虑了静态摄像机网络，而不是我们考虑的问题域。无监督重新识别。无监督学习模型在重新识别中很少受到关注，沿着这个方向的代表性方法使用手工制作的外观-3. 方法为了在动态摄像机网络中适应re-id模型，我们首先制定了一个基于测地线流核的域感知重新识别方法，该方法可以有效地找到最佳源摄像机（从多个安装的摄像机中），以最小的额外努力与新引入的目标摄像机配对（第3.2节）。然后，为了利用来自最佳源相机的信息，我们提出了一种传递性推理算法，该算法可以提高网络中其他相机对的匹配性能（第3.3节）。3.1. 初始设置我们提出的框架从安装的摄像机网络开始，其中每个摄像机对之间的区别距离度量是使用离线密集训练阶段学习的。设N为r。就像在一个网络中一样，可能的相机对的数量是N。设{（xA，xB）}m2i i i=1特征[47，41，46，11]或显著性统计[71]，用于匹配人员，而不需要大量的标记数据。最近，基于字典学习的方法也被用于在无监督设置中重新识别[28，44，29]。尽管在现实世界的设置中是可扩展的，但是这些方法尚未考虑re-id问题的动态性质，其中新的相机可以在任何时间被引入到现有网络。开放世界的重新定义在[4]中引入了开放世界识别，试图从占主导地位的静态设置移动到动态和开放的设置，其中训练图像和类别的数量在识别中不固定。受这些方法的启发，最近很少有重新识别[77，8]的作品试图通过假设画廊和探针集包含不同的人的身份与这些方法不同，我们考虑开放世界重新识别的另一个重要方面，是训练样本的集合，其中xA∈RD表示来自相机视图A的训练样本的特征表示，并且xB∈RD表示同一个人在不同相机视图B中的特征表示。我们假设所提供的训练数据是用于单次射击的任务，儿子重新识别，即，只存在同一个人的两个图像给定训练数据，我们遵循KISS度量学习（KISSME）[30]并计算成对距离矩阵，使得同一个体的图像之间的距离小于不同个体的图像之间的距离。KISSME的基本思想是通过考虑两个高斯分布的对数似然比检验来学习马氏距离。不相似对和相似对之间的似然比检验可以写为1exp（−1xT−1xij）R（xA，xB）=logCD2ijD（1）ij1exp（−1xT−1xij）摄像机网络是动态的，系统必须包含CS2ijS以最小的额外努力来评价新相机。其中x=xA−xB，C√=2π|Σ|,C√=2π|Σ|、域适配。领域自适应是指将一个源域自适应到一个目标域，它已广泛应用于计算机视觉和机器学习的许多领域。尽管它适用于古典视觉DD S SCXD和CXS是不同和相似的协方差矩阵。分别为两对。通过简单的操作，（1）可以写为R（xA，xB）=xTMxij（2）i j ij任务，用于重新识别的域适配仍然存在其中M=−1−−1是马氏距离be-作为一个具有挑战性和解决不足的问题。非常S D最近，已经开始考虑RE-ID的域适配[34，75，62，45]。然而，这些研究仅考虑在具有固定数目的摄像机的静态摄像机网络中提高re-id性能据我们所知，这是第一个解决不受约束的开放世界设置中重新识别的内在动态性质的工作，即，新的摄像机可以被引入到现有的网络中，并且系统将不得不在最少或没有人的监督的情况下合并这些摄像机以进行重新识别。与一对摄影机关联的补间协方差。我们跟着-low [30]并通过本征分析剪切频谱，以确保M是半正定的。请注意，我们的方法是不可知论的选择，以满足-RIC学习算法，用于在已安装的网络中学习摄像机对的最佳度量。我们采用KISSME在这项工作中，因为它是简单的计算，并已被证明是令人满意的人re-id问题。我们还将在第4.4节中使用Logistic DiscriminantBased Metric Learning（LDML）[21]而不是KISSME进行实验。7057OO2θii=1J我JK3.2. 发现最佳源相机Objective. 给定一个现有的摄像机网络，其中使用上述训练阶段计算所有可能的摄像机对的最佳匹配度量，我们的第一个目标是选择相对于新插入的摄像机具有最低内核距离的最佳源摄像机是由连续变量y∈[0，1]参数化的测地线流，表示如何将样本从原始D维特征空间平滑地投影到相应的低维子空间上。两个摄像机上的测地线流可以定义为[18]，如果y=0，则为在新相机中标记数据，然后学习距离与现有的N个摄像机的指标实际（y）=如果y=1，则XTX˜SUV(y)−X˜SUV(y)otherwise（四）不可能，因为标记所有样品通常需要单调乏味的人类劳动为了克服这样一个重要的问题，我们采用了一种基于测地线流核[18，19]的无监督策略来学习度量，而不需要来自新引入的相机的任何标记数据。11o2 2其中X<$S∈RD×（D−d）是X<$S的正交矩阵，U1，V1，U2，V2由以下SVD对给出XST X T= U V P T，X ST X T= −U V P T。（五）1 1O2 2方法细节。我们发现利用上述定义的矩阵，KST可以计算为：最佳源相机包括以下步骤：（i）以下各项─在新（目标）摄像机之间放置测地线流核STΣ Σ联系我们和其他现有的相机（源）;（ii）使用内核来K=XSU1XSU2G1UTXST（六）确定它们之间的距离;（iii）对源进行排序2o基于相对于目标相机的距离来选择相机，并且选择具有最低距离的相机作为最佳源相机。其中G=Σ诊断[1+]sin（2θi）] diag[（cos（2θi）−1）2θi]和设{Xs}N是N个源摄像机和XT 是diag[（cos（2θi）−1）]diag[1−sin（2θi）]s=12θi2θi新推出的目标摄像头。要计算核，[θi]d表示源和一种无监督的方式，我们扩展了以前的方法[18]，该方法在对象识别的上下文中调整分类器，以在动态相机网络中重新识别。我们的方法的主要思想是计算表示两个摄像机（一个源和一个目标）的数据的低维子空间，然后将它们映射到Grass-mannian1上的两个点。直觉上，如果这两个点在格拉斯曼上接近，则计算的核将在目标相机上提供高匹配性能。换句话说，两个摄像机可以彼此类似目标摄像头一旦我们使用（6）计算目标相机和源相机之间的所有成对测地线流核，我们的下一个目标是找到所有这些对之间的距离最接近新引入的相机的源相机更可能比其他相机更好地适应。我们遵循[54]来计算目标相机和源相机对之间的距离。具体地，给定核矩阵KST，源相机和目标相机的数据点之间的距离被定义为：DST（ xS， xT）= xST KST xS+ xTT KST xT−2 xST KSTxT并且它们的特征可以类似地分布在核心上，i j i i jj i j（七）响应子空间。为了简单起见，让我们假设研究了源摄像机XS和新引入的目标摄像机XT之间的核矩阵KST ∈ RD × D的计算问题。设X<$S∈RD×d和X<$T∈RD×d表示d维子空间，用偏最小方法分别对源相机和目标相机进行平方（PLS）和主成分分析（PCA）。请注意，我们不能在目标相机上使用PLS，因为它是一种监督降维技术，需要标签信息来计算子空间。给定两个子空间，源和目标摄像机之间的测地线流核的闭环解定义为：∫其中，DST表示在源相机和目标相机上定义的核距离矩阵。我们计算距离矩阵DST的平均值，并将其视为两个相机对之间的距离。最后，我们选择具有最低距离的相机作为最佳源相机与新引入的目标相机配对。注1. 注意，我们不使用来自目标相机的任何标记数据来计算（6）中的测地线流核或（7）中的核距离矩阵。因此，我们的方法可以应用于在大规模相机网络中以最小的额外努力来适应re-id模型备注2. 我们假设新引入的摄像头将接近至少一个已安装的摄像头，因为我们STST我xT=1（y）T0xS）T（（y）xT）dy（3）认为它们在相同的时间窗口内运行，因此具有类似的环境因素。此外，我们的AP-其中xS和xT表示第i个的特征描述符方法不限于单个摄像机，并且可以容易地被移除。i j倾向于更现实的场景，其中多个凸轮-第j个采样。（y）X70581设d是子空间的维数，所有d维子空间的集合构成格拉斯曼。同时将ERA引入现有网络可以基于最低平均距离容易地找到共同的最佳源相机以与所有新相机配对，或者7059i，j=1，i ji=1⋆多个最佳源相机，每个目标相机一个，以类似于上述方法的无监督方式。在16台摄像机的大规模网络上进行的实验表明，我们的方法在同时引入多台摄像机的情况下是有效的（见第4.2节）。3.3. 再识别的传递性推理Objective. 在上一节中，我们介绍了提出了一种域感知重识别方法，该方法可以有效地找到最佳源摄像机与目标摄像机配对，在动态摄像机网络中获取摄像机。确定最佳源摄像机后，下一个问题是：我们能否利用最佳源摄像机信息来提高其他摄像机对的重新识别精度？3.4. 半监督自适应的扩展虽然我们的框架是为re-id模型的无监督适应而设计的，但如果新引入的目标相机的标记数据可用，则可以很容易地扩展。具体地，可以在计算子空间的同时对来自目标相机的标签信息进行编码。也就是说，代替使用PCA来估计子空间，我们可以使用偏最小二乘（PLS）通过利用标记信息来计算目标数据上的区分子空间。PLS已被证明可以有效地通过将带有标记信息的数据投影到公共子空间来找到判别子空间[17，57]。这本质上导致了动态相机网络中re-id模型的半监督自适应（参见第4.3节中的实验）。方法细节。设{Mij}N是最佳在N个摄像机的网络中学习的成对度量如下：在3.1节中，S是3.2节之后新引入的目标摄像机T的最佳源摄像机。由于Schur产品在OP中的有效性erations研究[31]，我们开发了一种简单而有效的传递算法，用于利用来自最佳源相机的信息Schur乘积（a.k.a. Hadamard积）已成为提高多准则决策矩阵一致性和可靠性的重要工具。我们的问题自然适合这样的决策系统因为我们的目标是通过最佳源相机在两个相机之间建立路径给定最佳源摄像机S，我们如下计算剩余源摄像机和目标摄像机之间的核矩阵，KST =MSSKST，[S]N，S=S（8）其中，K∈ST表示通过利用来自最佳源相机S的信息而在源相机S和目标相机T之间更新的k内核矩阵。该算子记为两个矩阵的Schur积.当量图8通过在最佳源摄像机S中的可能出现的域上进行边缘化来建立摄像机对（S，T）之间的间接路径。换句话说，摄像机S起着目标摄像机T和所有其他源摄像机之间的连接器的作用。总之，为了在动态网络中适应re-id模型，我们使用使用（6）计算的核矩阵KST来获得跨新插入的目标相机和最佳源相机的re-id准确度，而我们使用更新的使用（8）计算的核矩阵，以找到现有网络中目标摄像机和剩余源摄像机之间的匹配第三条虽然有更复杂的策略来合并辅助信息，但采用（8）中的简单加权方法的原因是，通过这样做，在实时应用中，可以容易地将重新识别模型缩放到涉及数百个摄像机的大此外，所提出的传递算法在几个动态摄像机网络中令人满意地执行，如第4节所示。4. 实验数据集。我们在四个不同的公开可用数据集上进行实验，以验证我们的框架的有效性，即WARD [51]，RAiD [12]，SAIVT-SoftBio [7]和Shinpuhkan 2014[27]。尽管有许多其他数据集（例如ViPeR [20]，PRID2011 [22]和CUHK [33]等）为了评估重新识别中的性能，这些数据集不符合我们的目的，因为它们只有两个摄像头或者是专门为基于视频的重新识别而设计的[61]。WARD、RAiD和SAIVT-SoftBio中的摄像机数量分别为3、4和8。Shinpuhkan2014是最大的公开可用的数据集之一，具有16个摄像头。这些数据集的详细说明见补充材料。特征提取和匹配。特征提取阶段包括提取[39]中提出的用于人物表示的局部最大发生率（LOMO）特征描述符有26，960个维度。我们遵循[30，52]并应用主成分分析将所有实验中的维数减少到100。没有低维特征，如[30，52]中所讨论的，计算为了计算摄像机之间的距离以及re-id匹配分数，我们使用内核距离[54]（等式7）对于给定的投影度量。绩效指标。我们展示的结果识别率作为累积匹配特征（CMC）曲线和归一化曲线下面积（nAUC）值，这是re-id文献中的常见做法[26，12，50，71，28]。由于篇幅限制，我们仅报告大多数实验的平均CMC曲线，并将完整的CMC曲线留在补充材料中。实验设置。我们在所有实验中保持以下惯例：所有图像均归一化为128×64，以与采用最先进方法进行的评价一致[3，12，11]。关注-在文献[12，30，39]中，训练集和测试集通过挑选可用数据的一半来保持不相交，7060我们的（nAUC 96.58）最佳-G FK （nA U C 8 1.1 5 ）直接-GFK （nAUC71.10）CPS（nAUC 93.62）SD A L F（nA U C 8 0.6 9 ）我们的（nAUC 96.28）最佳-GFK （nAUC 89.59）直接-GFK （nAUC79.52）CPS（nAUC 93.62）SDALF（nAUC 80.69）v 年龄超过所有目标一伊纳翁斯我们的（n A U C 7 8 .7 8 ）最佳-G F K （n A U C 7 4 .2 5 ）直接-G F K （n A U C 7 4 .3 4 ）C P S （n A U C 72 .9 7）S D A L F （nA U C 6 6 .9 2 ）认可百分比认可百分比10 0累积匹配特性（CMC）当摄像机1作为目标时，所有摄像机对的平均值（最佳源-摄像机3）100累积匹配特性（CMC）当摄像机2作为目标时，所有摄像机对的平均值（最佳源-摄像机3）10 0累积匹配特性（CMC）当摄像机3作为目标时，所有摄像机对的平均值（最佳源-摄像机2）90909080808070707060606050505040302010012 4 6 8 10121416182040302010012 4 6 81012 14 16 18 2040302010012 4 6 81012 14 16 18 20排名分值排名分值排名分值(a)摄像机1作为目标（b）摄像机2作为目标（c）摄像机3作为目标图2. WARD数据集的CMC曲线（3台摄像机）。图（a、b、c）示出了在将摄像机1、2和3分别引入动态网络时不同方法的性能。有关结果分析，请参见第4.1节中的文本最好用彩色观看累积匹配特性（CMC）100908070605040302010100908070605040302010阿尔儿卡梅尔梳ti智能数据集我们还实施Best-GFK和直接GFK基线在相同的实验设置，如前所述，有一个公平的比较与我们提出的方法。对于所有的数据集，我们认为一个相机作为新引入的目标相机，所有其他相机作为源相机。我们考虑了所有可能的组合-012468101214161820排名分值012468101214161820排名分值国家进行实验。我们先选(a)RAiD（b）SAIVT-SoftBio图3. CMC曲线平均超过所有目标相机组合，介绍了一次一个。(a)具有4个相机的RAiD数据集的结果（b）具有8个相机的SAVIT-SoftBio数据集的结果。有关结果分析，请参见第4.1训练集和剩下的一半用于测试。我们重复每个任务10次，从每个身份随机挑选5张图像，用于训练和测试时间。所有可能组合的子空间维数保持在50。4.1. 通过引入新相机目标. 该实验的目标是分析我们的无监督框架的性能，同时将单个相机引入现有网络，其中使用密集训练阶段学习最佳距离度量。比较方法。我们将我们的方法与几种无监督的替代方案进行比较，这些替代方案分为两类：（i）手工制作的基于特征的方法，包括CPS [11]和SDALF [3]，以及（ii）基于测地线流内核的两种基于域自适应的方法（Best-GFK和Direct-GFK）[18]。对于Best-GFK基线，我们通过应用-计算核矩阵，在最佳源和目标相机[18]，而在Direct-GFK基线中，我们使用直接跨源计算的内核矩阵和目标摄像机使用（6）。与Best-GFK进行比较的目的是为了表明，在计算其他源相机和目标相机的匹配性能时，跨最佳源相机和目标相机计算的核矩阵实施详情。我们使用公开的代码CPS和SDALF和测试我们的经验，源摄像机与目标摄像机最佳匹配，然后，使用所提出的传递算法来计算剩余摄像机对的RE-ID性能。结果图2显示了3个摄像头WARD数据集上所有可能的3种组合（两个源和一个目标）的结果，而图2显示了所有可能的3种组合的结果。3显示了所有可能组合的平均每平方米，相机，分别在RAiD和SAIVT-SoftBio数据集上从所有三个图中，可以得出以下观察结果：（i）所提出的用于重新识别的框架在所有三个数据集上的表现明显优于所有比较的无监督方法。(ii)其中，CPS基线最具竞争力。然而，由于两个引入的组件协同工作，该差距仍然很大：发现最佳源相机并利用其信息进行重新识别。在WARD、RAiD上，与CPS相比，Rank-1性能提高了23.44%、24.50%和9.98和 SAVIT-SoftBio 数据集。 (iii) 在大多数情况下，Best-GFK比Direct-GFK工作得更好，这表明在最佳源相机和目标相机上计算的内核可以应用于在重新识别中找到其他相机对上的匹配精度。(iv) 最后，我们的方法和Best-GFK之间的性能差距（RAiD上nAUC的最大改进为17%）表明，所提出的传递算法在利用最佳源相机的信息，同时计算跨相机对的re-id精度方面是4.2. 介绍多个摄像机目标. 该实验的目的是验证我们提出的方法的有效性，同时在动态摄像机网络中引入多个摄像机我们的（nAUC 95.17）最佳-GFK （nAUC 82.60）直接-GFK （nAUC77.97）CPS（nAUC89.56）SDALF（nAUC 74.80）累积匹配特性（CMC）所有目标摄像机组合的平均值我们的（nA UC 9 2 .31）最佳-G FK （nA UC 7 6 .05 ）直接-G FK （nA UC 7 2 .10 ）CP S （nA U C 8 0 .8 0 ）SD A L F （n A U C 8 1 .5 2 ）认可百分比认可百分比认可百分比7061我们的（nA U C 8 1.1 1 ）最佳-G FK （nA U C 7 9.5 9 ）直接-G FK （nA U C 7 0.7 5 ）CPS（nAUC 75.17）SD A L F（nA U C 6 7.2 1）我们的（nAUC 81.94）最佳-GFK （nAUC 78.68）直接-GFK （nAUC 73.66）CPS（nAUC 76.17）SDALF（nAUC 68.30）v 年龄超过所有目标一伊纳翁斯我们的（nA UC 7 8 .78）我们的半10 0 % （nA UC 7 9 .85 ）我们的半-50 % （nA UC 7 4 .56 ）我们的半-25 % （nA UC 7 2 .56 ）我们的半10 % （nAU C 71 .9 3）0认可百分比认可百分比10 0累积匹配特性（CMC）当摄像机2，9作为目标时，所有摄像机对的平均值（最佳源-摄像机3）累积匹配特性（CMC）当摄像机3、13、9作为目标时，所有摄像机对的平均值（最佳源-摄像机12）100累积匹配特性（CMC）当摄像机2，5，7，8，14作为目标时，所有摄像机对的平均值（最佳源-摄像机9）10 090 909080 808070 707060606050403020100123456789101112排名分值(a) 摄像机2、9作为目标504030201001234567891011 12排名分值(b) 摄像机3、9、13作为目标504030201001 2 3 4 5 6 7 8 9101112排名分值(c) 摄像机2、5、7、8、14作为目标图4. 包含16台相机的Shinpuhkan2014数据集的CMC曲线。图（a、b、c）示出了在同时分别引入2、3和5个相机时不同方法的性能。有关结果分析，请参见第4.2累积匹配特性（CMC）实施详情。我们进行这个实验在Shinpuhkan2014数据集[27]上使用16台相机。我们跑了-Domly选择2、3和5个摄像机作为目标摄像机，而剩余的摄像机是可能的源摄像机。对于每种情况，我们根据平均距离选择共同的最佳源相机，并遵循与第二节相同的策略100908070605040302010100908070605040302010阿尔儿卡梅尔梳ti第4.1节。多个最佳源摄像机的结果，一个用于0124681 01 21 4161 820排名分值12468101 21 41 61 820排名分值每个目标摄像机，包括在补充。结果图4示出了在Shin-puhkan 2014数据集上分别随机引入2、3和5个相机从图 4（a、b和c），可以得出以下结论：（i）与第4.1节中的结果类似，我们的方法在所有三种情况下都优于所有比较方法。这表明，该方法是非常有效的，可以应用于大规模的动态摄像机网络，其中可以同时引入多个摄像机（ii）我们和Best-GFK之间的差距是中等的，但我们仍然在nAUC值上提高了4%，这证实了传递性推理在大规模相机网络中重新识别的有效性。4.3. 半监督自适应的扩展目标. 该方法可以很容易地扩展到半监督设置时，标记的数据从目标相机变得可用。本实验的目的是分析我们的方法的性能，在这样的设置，通过将标记的数据从目标域。比较方法。我们将所提出的非监督方法与我们的方法的四种变体进行比较，其中10%，25%，50%和100%的标记数据来自目标摄像机分别用于估计核矩阵。实施详情。我们遵循相同的实验策略，在相机网络上找到平均re-id精度。然而，我们使用PLS代替PCA，分别考虑10%，25%，50%和100%的标记数据来计算目标摄像机的判别子空间结果我们从图中有以下主要发现。5：（i）正如预期的那样，半监督基线Ours-Semi-100%工作得最好，因为它使用来自目标域的所有标记数据来计算核函数。(a) RAiD（b）SAIVT-SoftBio图5.带标记数据的半监督自适应图（a，b）显示了在所有目标相机组合上平均的CMC曲线，分别在RAiD和SAVIT-SoftBio上一次引入一个。有关结果分析，请参见第4.3节中的文本寻找最佳源相机的方法。(ii)我们的方法在两个数据集上都与我们的半100%有竞争力（Rank-1准确度：RAiD 上为 60.04% vs 59.84% ， SAVIT-SoftBio 上为26.41% vs 24.92%）。然而，重要的是要注意，从目标相机收集标记的样本在实践中非常困难。(iii)有趣的是，我们的无监督方法和其他三个半监督基线（ Ours-Semi-50% ， Ours-Semi-25% 和 Ours-Semi-10%）之间的性能差距在RAiD上是中等的（图11）。5-a），但在SAVIT-SoftBio上，差距是显著的（图5-a）。5-b）。我们认为这可能是由于目标相机中缺乏足够的标记数据来提供PLS子空间的可靠估计。4.4. 基于LDML度量学习的再辨识目标.本实验的目的是通过改变第3.1节中给出的初始设置来验证我们方法的有效性。具体来说，我们的目标是通过用LDML度量学习[21]取代KISSME [30]来展示所提出方法的性能理想情况下，我们希望通过我们的方法获得类似的性能改进，而不管用于学习现有相机网络中的最佳距离度量的度量学习结果图6显示WARD和RAiD回收的结果。以下是对数字的分析：（i）我们的方法在两个数据集中的表现优于所有比较方法，这表明拟议的适应技术-我们的（nAUC 79.25）最佳-GFK （nAUC 78.06）直接-GFK （nAUC 76.14）CPS（nAUC77.10）SDALF（nAUC66.95）累积匹配特性（CMC）所有目标摄像机组合的平均值我们的（nA UC 9 2.3 1）我们的半10 0 % （nA UC 92 .48）我们的半-50 % （nA UC 91 .9 1 ）我们的半-25 % （nA UC 91 .6 4 ）我们的半10 % （nA UC 88 .29 ）认可百分比认可百分比认可百分比70621 0 09 08 07 06 05 04 03 02 01 0所有目标相机组合的累积匹配特征（CMC）平均值12468101 21 41 61 82 0排名分值1009080706050403020100所有目标相机组合的累积匹配特征（CMC）平均值12468101214161820排名分值表1. 与监督方法的比较。数字显示了在所有可能的目标相机组合上平均的等级1识别分数（以%表示），每次引入一个。(a) WARD（b）RAiD图6.使用LDML作为初始设置的Re-id性能。图（a，b）显示了分别在WARD和RAiD上每次引入一个的所有目标摄像机组合无论现有摄像机网络中使用的度量学习方法如何，Nique 都工作得非常好。 (ii) 与 WARD 数据集上的KISSME相比，所提出的方法在LDML上的效果略好（秩1准确度为73.77vs 68.99然而，RAiD的边际变小（61.87 vs 59.84），这是一个相对复杂的re-id一次只引进一台相机。结果表1示出了在动态网络中一次一个地引入的所有可能的目标相机我们从表1中得到了以下关键发现：（ i）我们的无监督方法的两种变体（ Ours-K 和Ours-L）在两个数据集上的性能都优于所有基于特征变换的方法，2个室外和2个室内摄像机的数据集（iii）虽然LDML的性能略优于KISSME，但重要的是要注意，KISSME在学习 WARD 数据集中的指标方面比 LDML 快约40%。KISSME在计算上是高效的，因此更适合于在大规模相机网络中学习度量4.5. 与监督再鉴定的比较目标. 本实验的目的是比较我们的方法与监督的替代品在动态相机网络的性能。比较方法。我们比较了几个su-pervised替代方案，这些替代方案分为两类：（i）基于特征变换的方法，包括FT [49]，ICT [2]，WACN [51]，其学习特征在两个相机之间变换的方式，然后将其用于匹配，(ii)基于度量学习的方法包括KISSME[30]，LDML[21]，XQDA[39]和MLAPG[38]。如前所述，我们的模型可以在任何初始网络设置下运行，因此我们显示了KISSME 和 LDML 的结果，分别表示为 Ours-K 和Ours-L。请注意，我们无法与最近的基于深度学习的方法进行比较，因为它们大多特定于静态设置，并且它们的成对相机结果在实验数据集上不可用。我们没有在我们的动态设置中重新实现这些方法，因为很难预先模拟所有的实现细节。实施详情。为了报告现有的基于特征变换的方法结果，我们使用[12]中先前发表的性能。对于基于度量学习的方法，我们使用公开可用的代码并在我们的前许可的数据集。给定一个新引入的相机，我们使用基于度量学习的方法来重新学习成对的距离度量，使用相同的训练/测试分割，如前面在实验设置中提到的。对于每个数据集，我们显示了所有可能组合的平均性能，金酒(ii)在具有3个摄像机的WARD数据集上，我们的方法在两种设置上都非常有竞争力：Ours-K优于KISSME和LDML，而Ours-L则优于MLAPG。这一结果表明，我们的方法是更有效的匹配人在一个新引入的相机和前源相机通过利用信息从最佳源相机通过传递性推理。(iii)在具有4个相机的RAiD数据集上，我们的方法和基于度量学习的方法之间的性能差距开始增加。这是预期的，因为对于涉及更多相机对的大型网络，无监督方法无法与监督方法竞争，特别是

下载后可阅读完整内容，剩余1页未读，立即下载

cpongm

粉丝: 5
资源: 2万+

开放世界动态摄像机网络中的人的重新识别方法

通过抓网络数据包怎么识别出来这些数据是不是网络摄像机的数据？

通过抓网络数据包怎么识别出来这些数据是不是网络摄像机的数据？用深度学习技术怎么判断？

pico 摄像机识别地形

基于手机摄像机的手写数字识别

onvif 网络摄像机 服务端

海康威视 网络摄像机 delphi

ubuntu网络摄像机

小米摄像机nas网络存储怎么弄

多路视频网络摄像机 onvif

ros 海康网络摄像机

常见摄像机标定方法有哪些

javacv获取网络摄像机

紫光华智网络摄像机 sdk 实时播放

unity3d摄像机跟随人物

摄像机变焦来跟踪人形原理及意义 900字

常见双目摄像机标定方法有哪些

unity 朝向摄像机

python+opencv单目摄像机测距

onvif摄像机搜索软件

单目摄像机产生视觉识别matlab源码

最新资源

onvif 网络摄像机服务端

海康威视网络摄像机 delphi