全局特征拼接提升行人重识别:95.9% Rank-1精度

3 下载量 6 浏览量 更新于2024-08-13 2 收藏 946KB PDF 举报
本文主要探讨的是"基于全局特征拼接的行人重识别算法研究"。当前行人重识别技术面临着网络模型复杂化以及识别率不高的挑战。为了应对这些问题,研究者提出了一种创新的方法,即利用卷积神经网络(CNN)提取行人图像的全局特征。这种方法首先通过CNN的不同卷积层获取多层面的特征,这些特征具有不同的抽象层次,拼接起来可以提供更全面的信息,有助于提高识别的准确性。 在特征提取阶段,研究者对来自不同卷积层的特征进行融合,这使得最终的特征能够包含丰富的上下文信息,从而增强其表征能力。在训练过程中,采用了两种先进的损失函数——聚类损失函数和标签平滑损失函数,它们结合使用能够减少过拟合的风险,同时提高模型对不同个体间的区分度。 此外,文章还介绍了两种训练技巧:随机擦除和减小池化步长。随机擦除是为了增加模型对图像局部变化的鲁棒性,而减小池化步长则有助于保留更多的细节信息,这对行人重识别这类对细节敏感的任务至关重要。这些优化策略显著提升了模型的性能。 实验结果在多个知名的数据集上进行了验证,包括Market1501、DukeMTMC-reID、CUHK03和MSMT17,其中在Market1501数据集上,算法表现出色,Rank-1精度达到了95.9%,mAP值更是达到了94.6%,这证明了该算法的有效性和优越性。本文提出的基于全局特征拼接的行人重识别算法在保持模型简洁性的同时,提高了识别准确性和鲁棒性,为行人重识别领域的研究提供了新的视角和方法。