基于层次多任务学习与关系注意力的行人属性识别

下载需积分: 19 | PDF格式 | 1.83MB | 更新于2024-09-04 | 92 浏览量 | 0 下载量 举报
收藏
本文主要探讨了"MTMS+Att PAR + via Hierarchical Multi-task Learning and Relationship Attention"这一主题,聚焦于行人属性识别(Pedestrian Attribute Recognition, PAR)在视频监控分析中的关键作用。作者提出了一种新颖的端到端深层学习方法来提升PAR任务的性能。这种方法将语义分割融入到行人属性识别中,并将其视为一个多任务学习问题,从而引入了像素级别的监督。 首先,通过构建一个层次化的多任务网络架构,该网络将PAR任务与图像分割任务相结合。这样做的好处在于,通过共享底层特征提取层,两个任务能够相互促进,提高模型的泛化能力和对复杂场景的理解。层次结构使得网络能够处理不同尺度和抽象级别的信息,有助于更准确地捕捉行人特征及其相关属性。 其次,关系注意力机制(Relationship Attention)被引入到网络中,这一创新性设计允许模型关注行人之间的关系,如姿势、服装和配件等特征。关系注意力机制有助于捕捉到行人之间潜在的联系,例如,一个人的帽子可能与他们的上衣颜色或发型有关,这种上下文信息对于准确识别属性至关重要。 此外,多任务学习的优势在于它能够利用大量的标注数据,因为每个任务都提供了一定程度的训练信号。这有助于减少过拟合,提高模型的鲁棒性,使其能够在不同的行人属性类别上达到更好的性能。 总结来说,这项研究通过结合层次化的多任务学习和关系注意力机制,显著提升了行人属性识别的精度和效率。这种方法不仅在个体行人属性识别上表现出色,还能够捕捉到行人之间的复杂关系,为视频监控中的智能分析提供了强有力的支持。研究人员来自北京航空航天大学计算机科学与工程学院的北京大数据和脑计算高级创新中心,共同作者包括Lian Gao、Di Huang、Yuanfang Guo 和 Yunhong Wang,他们分别在论文中展示了他们在该领域的专业知识和贡献。

相关推荐

filetype
26 浏览量