RGB-D融合技术提升人员再识别性能:一种不相似空间融合策略

PDF格式 | 17.67MB | 更新于2025-01-16 | 150 浏览量 | 0 下载量 举报
收藏
RGB-D融合技术在人员重新识别中的应用是一项前沿的计算机视觉研究,特别是在安防监控领域。它旨在通过结合RGB(颜色)图像和深度信息(Depth)来提升人员识别的精度和鲁棒性,尤其是在复杂的光照条件下。RGB-D传感器如Microsoft Kinect和Intel RealSense提供了多模态数据,包括RGB图像、深度图以及骨骼信息,这些数据对于创建不变于光照变化的特征至关重要。 当前的深度学习模型在多模态融合上已经取得了一定进步,然而,这些方法往往缺乏动态选择最具辨别力卷积滤波器的能力,导致可能在融合过程中引入噪声,影响最终的特征嵌入和识别性能。本文作者提出了一种创新的方法,即在不相似空间中融合RGB和RGB-D信息。通过训练两个独立的CNN,分别针对RGB和RGB-D输入,生成独特的特征嵌入。不相似度分数被用来整合这两种模态的证据,从而减少冗余和噪声的影响,提高匹配的准确性。 为了解决数据稀缺的问题,作者还贡献了一个新的RGB-D Re-id数据集——SUCVLRGBD-ID,该数据集包含58个不同身份的RGB和深度图像,来自三个摄像头的不同位置和光照环境。这使得研究人员能够在实际场景下评估和优化他们的算法。通过对SUCVLRGBD-ID和其他公开数据集的实验,结果证实了提出的融合策略的有效性,并证明了其在多种RGB-D应用中的通用性。 RGB-D融合技术在人员重新识别中的应用不仅关注深度学习模型的改进,还着重于数据集的建设与合理融合策略的设计,以适应实际场景中的复杂性和多样性。通过这种方法,智能监控系统的性能得到了显著提升,为安防监控领域带来了新的可能性。

相关推荐