深度学习行人再识别:去相关高精度网络与重排序技术

需积分: 10 0 下载量 35 浏览量 更新于2024-08-13 收藏 1.75MB PDF 举报
"基于去相关高精度分类网络与重排序的行人再识别" 行人再识别(Person Re-identification,简称Re-ID)是计算机视觉领域中的一个关键任务,它旨在在一个监控网络的不同摄像头之间识别出同一行人的身份。当前的深度学习方法通常依赖于预训练的分类网络,如ResNet或VGG,作为基础网络来提取行人图像的深度特征。这些特征随后通过欧氏距离计算相似度,构建排序列表以决定识别匹配度。然而,分类网络的特征表达能力和特征之间的相关性直接影响着再识别的准确性。 本文提出了一种新的行人再识别方法,旨在解决上述问题。首先,采用了具有更高精度的分类网络,比如squeeze-and-excitation networks (SENet),这类网络能够更好地捕获通道间的关系,从而提供更丰富的特征表示。SENet通过自适应地调整特征通道的重要性,增强了特征的表达力,有助于提高识别性能。 其次,为了减少特征之间的相关性,论文采用了奇异值分解(Singular Value Decomposition, SVD)技术。SVD可以分解权重矩阵,降低不同特征之间的相关性,优化深度学习过程,从而降低相似度计算的误差。这一步骤有助于提升特征的独立性和区分度。 此外,为了进一步提升再识别的精度,研究人员引入了基于K-Nearest Neighbor (KNN) 的重排序策略。在候选库中检索图片时,原始的排序可能会因为局部最优而产生误差。通过KNN重排序,可以考虑更多的上下文信息,更准确地评估图片间的相似性,从而提供更精确的匹配顺序。 在Market-1501数据集上进行的实验验证了这种方法的有效性。实验结果表明,结合高精度分类网络、特征去相关以及重排序策略的行人再识别方法显著提高了识别准确性,这为实际应用提供了有力的技术支持。 这篇论文贡献了以下几点: 1. 使用高精度的SENet网络作为特征提取器,增强行人特征的表达能力。 2. 应用奇异值分解来降低特征之间的相关性,优化深度学习过程。 3. 通过KNN重排序改进了候选图片的匹配精度,提升了整体的再识别效果。 这些创新点对于提高行人再识别系统的性能具有重要意义,特别是在复杂环境和大规模监控系统中,该方法有望带来更好的行人识别效果。同时,这种方法也为其他计算机视觉任务,如目标检测和跟踪,提供了有价值的参考。