范数感知嵌入:高效人物搜索技术

0 下载量 185 浏览量 更新于2025-01-16 收藏 1.12MB PDF 举报
"该文章探讨了一种名为Norm-Aware Embedding的新方法,旨在解决人物搜索任务中的关键挑战,即人物检测和人物重新识别的矛盾目标。这种方法将人物嵌入到范数和角度中,分别服务于检测和re-ID任务,以实现多任务的有效和高效训练。通过扩展到像素级人物嵌入,可以减少错位影响,提高识别准确性。在CUHK-SYSU和PRW数据集上的实验结果显示,该方法优于一步法,并且与两步法表现相当,同时在单个GPU上以12fps的速率运行,具备高效和资源友好的特点。" 人物搜索是一个结合了行人检测和人物重新识别的实用任务,它要求在一组图像中找到并定位与查询人物相同身份的所有实例。这一任务的挑战在于,检测任务关注所有身份的共性,而re-ID任务则需处理不同身份间的差异。为了解决这种矛盾,研究者提出了Norm-Aware Embedding技术。这一方法创新性地将人物嵌入分为两个部分:范数用于检测,角度用于re-ID。这样,范数可以区分人物与背景,角度则用于区分不同人物的身份,有效地缓解了类间距离的限制。 传统的L2归一化嵌入可能会导致人物类间角距离被背景压缩(如图1(a)所示),而Norm-Aware Embedding通过规范区分(图1(b))使得人物与背景分离,同时保留了身份识别的特性。通过这种方式,方法在保持高精度的同时,也提高了对视角变化、光照条件、背景复杂性和遮挡等挑战的适应性。 为了进一步提升性能,研究者还将人物嵌入扩展到了像素级,这意味着即使在局部错位的情况下,也能保持较高的识别能力。实验结果证明,这种像素级的识别能力相比传统的全局方法更为稳健。 在CUHK-SYSU和PRW两个标准数据集上,Norm-Aware Embedding方法的表现优于单一阶段的解决方案,并且其性能接近于分步的两阶段方法。这表明,新方法在保证效果的同时,简化了模型复杂性,可以在单个GPU上高效运行,为实际应用提供了便利。此外,由于其训练过程简单且资源需求较低,使得该方法在资源有限的环境下也有较好的适用性。 Norm-Aware Embedding是一种针对人物搜索任务的创新方法,通过优化人物和背景的表示,以及引入像素级的识别能力,实现了检测和re-ID的协同工作,为人物搜索任务提供了更高效、准确的解决方案。