孪生网络与重排序结合的行人重识别技术

2 下载量 112 浏览量 更新于2024-08-26 2 收藏 452KB PDF 举报
"该文提出了一种基于孪生网络和重排序的行人重识别方法,旨在解决非重叠多摄像头环境下的行人识别问题,克服光照、姿势和遮挡等因素的影响,以及减少图像错误匹配。利用孪生网络学习具有辨别力的CNN特征和相似性度量,通过k-最近邻(k-NN)方法降低错误匹配,再结合欧氏距离和杰卡德距离的加权重排序优化结果。实验在Market1501和CUHK03数据集上取得优秀性能,优于DNS等方法。" 行人重识别(Person Re-identification, Re-ID)是一项重要的计算机视觉任务,它涉及在不同的摄像头视图中识别同一行人的技术。在非重叠多摄像头系统中,Re-ID面临着诸多挑战,包括光照变化、行人的姿势变化以及可能的遮挡,这些因素会增加识别的难度。此外,实验过程中的图像错误匹配也会降低识别准确率。 本文提出的解决方案是采用孪生网络。孪生网络是一种深度学习架构,由两部分组成,可以同时学习输入图像的卷积神经网络(CNN)特征和它们之间的相似性度量。当给定一对行人训练图像时,网络能预测出这两个输入图像代表的行人身份,并判断它们是否属于同一个人。这种设计有助于提取鲁棒的行人特征,减小环境因素的影响。 为了进一步降低错误匹配,文中采用了k-互近邻(k-NN)算法。k-NN是一种基于实例的学习方法,通过查找训练集中最接近的k个邻居来决定测试样本的类别。在行人重识别中,这可以帮助排除与目标行人不匹配的图像。 重排序阶段,研究者将欧氏距离和杰卡德距离加权,对原始的排序表进行调整。欧氏距离通常用于测量两个向量之间的直线距离,而杰卡德距离则衡量两个集合的差异程度。结合这两种距离,可以更全面地评估图像间的相似性,从而提高最终的识别准确率。 实验在两个标准数据集Market1501和CUHK03上进行,结果表明,在Market1501上,Single Query情况下的Rank1精度达到了83.44%,mAP(mean Average Precision)为68.75%;而在CUHK03上,single-shot情况下的Rank1精度达到85.56%,mAP为88.32%。这些成绩显著优于DNS等其他方法,证明了所提方法的有效性和通用性。 这项研究通过集成孪生网络、k-NN和重排序策略,提高了行人重识别的准确性和鲁棒性,为非重叠多摄像头环境下的行人识别提供了一种新的有效方法。