领域自适应人物搜索:DAPS框架与性能提升

0 下载量 28 浏览量 更新于2024-06-19 收藏 1022KB PDF 举报
"这篇论文提出了一种新的方法,即领域自适应人物搜索(DAPS),以解决人物搜索模型在不同领域的泛化问题。该方法针对人物搜索中的行人检测和人物重识别(ReID)任务的域不对齐问题,以及在缺乏目标域标注数据的情况下的训练挑战。DAPS框架包含一个域对齐模块,用于减小源域和目标域之间的差异,以及一个动态聚类策略,能够有效地利用未标注数据进行训练。在PRW数据集上,DAPS实现了34.7%的mAP和80.6%的top-1准确率,甚至超越了一些全监督和弱监督的方法。论文作者来自上海交通大学人工智能研究所和腾讯优图实验室。" 本文主要关注的是人物搜索领域的跨域适应问题。人物搜索是一个复杂任务,涉及到行人检测和人物重识别,以往的研究大多在充分或弱监督的环境中取得进展。然而,当模型从一个有标签的源域转移到无标签的目标域时,模型的泛化能力往往受限,这主要是因为源域与目标域之间存在显著的“域间隙”。 为了克服这个难题,论文提出了DAPS框架。这个框架包含两个关键设计:1) 域对齐模块,它采用图像级和任务敏感的实例级对齐策略来减少源域和目标域之间的差异,以促进模型更好地适应目标域的数据特性;2) 动态聚类策略,该策略能够在没有目标域标注信息的情况下,通过分析未标注数据来生成伪标签,从而支持模型在目标域上的ReID和检测训练。 实验结果显示,DAPS在PRW数据集上表现出色,其无监督版本的表现甚至优于某些需要全面或弱监督的方法。这表明DAPS有效地解决了域适应问题,提高了模型在新环境中的性能。该研究为人物搜索的跨域应用提供了重要的理论基础和实践指导,对于提升现实世界中的视觉搜索系统性能有着重大意义。 关键词涉及人物搜索、领域适应,表明这是计算机视觉和机器学习领域的前沿研究,特别是对于解决实际应用中模型泛化能力的问题。作者团队结合了学术界(上海交通大学MoE人工智能重点实验室)和工业界(腾讯优图实验室)的力量,这反映了产学研结合在推动技术创新上的重要性。