视角优化的行人重识别模型:基于PSE的深度可分离卷积策略

1 下载量 76 浏览量 更新于2024-08-27 收藏 6.08MB PDF 举报
本文主要探讨了一种创新的行人重识别方法,即基于视角信息嵌入的模型。该模型针对行人图像中视角朝向的特性,对PSE(Pose-Sensitive Embedding)网络结构进行了优化。PSE原本是通过融合特征来提取行人姿态信息的,但作者在此基础上进行了改进,将特征融合部分替换为三个视角单元特征向量的拼接,这样更好地适应了不同视角下特征空间的特性和多样性。 在设计上,视角单元不再仅依赖于骨架网络较深的block-3,而是从浅层提取更丰富的视角特征,增加了三个单元之间的差异性。这样做有助于增强模型对视角变化的鲁棒性,使得每个视角单元能更好地捕捉特定方向的特征。为了进一步提升特征提取效率和防止过拟合,文章引入了改进的深度可分离卷积技术。这种模块设计不仅减少了模型参数的数量,还增强了网络的非线性表达能力,提高了泛化性能。 实验部分,作者在业界常用的数据集Market1501、Duke-MTMC-reID和MARS上对这一算法进行了验证。结果显示,相较于传统方法,基于视角信息嵌入的模型在行人重识别任务中表现更为出色,能够更准确地识别出具有不同视角的行人,从而证明了其在实际应用中的优越性。 这篇研究将视角信息的有效利用与深度学习技术相结合,提升了行人重识别的精度和鲁棒性,对于推动该领域的研究和技术进步具有重要意义。关键词包括机器视觉、光计算、行人重识别、视角信息嵌入、深度残差卷积神经网络以及深度可分离卷积,这些关键词共同揭示了文章的核心技术和研究背景。