核Fisher判别度量学习在行人重识别中的应用

需积分: 17 3 下载量 21 浏览量 更新于2024-09-06 收藏 257KB PDF 举报
"基于核Fisher判别度量学习的行人重识别 .pdf" 行人重识别是计算机视觉领域的一个重要挑战,特别是在智能监控和安全系统中。该技术旨在识别跨不同摄像头视图的同一行人的身份,尽管这些视图可能具有各种光照、角度、遮挡等因素的差异。这篇由李昭青、陈振学和李秀清共同撰写的论文探讨了一种基于核Fisher判别度量学习的方法来解决这一问题。 在行人重识别领域,通常有两种主要的研究方法:特征表示学习和度量学习。特征表示学习着重于学习有效的特征,使不同视角下的行人图像能够被有效区分。然而,度量学习则更专注于优化相似性度量,以便在不同的特征空间中找到最佳的相似性标准。由于度量学习对于处理视图变化的鲁棒性,它在行人重识别任务中往往能取得更好的性能,这正是本文研究的核心。 论文中提出的方法首先采用了核化的Fisher判别算法(Kernel-based Fisher Discriminant Analysis, KFDA),这是一种非线性的降维技术。KFDA通过将数据映射到高维的特征空间,使得原本在原始低维空间中线性不可分的数据在新的空间内变得可分。这种方法能够保留原始数据的重要信息,同时减少噪声和冗余,提升样本数据的表达能力。 接下来,为了进一步优化度量学习,论文使用了L1损失函数对样本进行约束,以学习一个距离度量矩阵。L1损失函数因其对异常值的鲁棒性和稀疏性诱导特性,常被用于回归和优化问题。通过这种方式,可以更好地捕捉样本间的差异,从而提高匹配的准确性。 最后,论文的方法通过计算经过度量学习后的样本间距离,来进行行人重识别。匹配过程中,选取最接近的样本作为识别结果,通常用排名匹配准确率(如Rank-1)来评估模型的性能。实验结果显示,与MLAPG方法相比,该方法在VIPeR、QMULGRID和CUHK01这三个广泛使用的数据集上都实现了Rank-1匹配准确率的提升,分别为0.39%、0.13%和0.62%。这表明了所提出的核Fisher判别度量学习方法的有效性。 总结来说,这篇论文贡献了一种创新的行人重识别技术,利用核Fisher判别和L1损失函数优化度量学习,以应对跨摄像头行人识别的挑战。这一方法不仅理论上有其独特性,而且在实际数据集上的表现也证明了其潜力,对于未来的研究和应用具有重要的参考价值。