HOI交互检测:从传统到Transformer的演进
需积分: 5 155 浏览量
更新于2024-08-05
收藏 3.23MB PPTX 举报
"这篇PPT主要探讨了人-物体交互检测(HOI)技术,这是一种在计算机视觉领域中用于识别图像中人体与物体之间交互关系的任务。内容涵盖了HOI检测的传统方法、两阶段方法和单阶段方法,并提到了基于Transformer的新技术。此外,PPT还列举了一些常用的HOI数据集,如V-COCO、HICO-DET、HAKE、HOI-A和sportsevent。对于评价标准,提到了平均精度均值(MAP)。PPT还介绍了几篇重要的研究论文及其创新点,包括HO-RCNN、iCAN、InteractNet和GPNN,这些论文都提出了新的方法来提升HOI检测的性能,如利用空间位置信息、注意力机制、图解析网络和身体部位信息。"
在HOI检测技术中,传统方法依赖于手工特征,如颜色、HOG和SIFT,并结合贝叶斯模型进行分类。而两阶段方法则分为目标检测和交互推理两个步骤,先检测人体和物体,再推理它们之间的交互。单阶段方法则尝试直接从图像中检测HOI三元组,简化了流程。
V-COCO和HICO-DET是两个广泛使用的HOI数据集,分别包含不同数量的图像,用于训练和测试模型。这些数据集的多样性对于评估和改进HOI检测算法至关重要。近年来,研究者们提出了许多新方法,如基于Transformer的模型,以及弱监督和零样本学习,以应对HOI检测的挑战。
论文“HO-RCNN”在HICO数据集基础上创建了HICO-DET,引入深度神经网络(DNN)框架,利用人体与物体的空间位置信息提升检测效果。而“iCAN”引入了实例中心的注意力模块,通过人体或物体的外观特征来聚焦相关区域,同时考虑人与物的空间特征判断交互。InteractNet以人为中心,用高斯分布预测人与物体的相对位置,提高动作分类和目标定位的准确性。最后,GPNN通过构建图解析网络,利用图结构和节点更新来自动解析HOI关系,提高了检测性能。
这些研究的创新点在于不断优化HOI检测的各个方面,包括特征表示、注意力机制、模型结构和学习策略,推动了HOI检测技术的发展。通过结合不同的信息源,如空间位置、外观特征、身体部位和图结构,这些方法能够更准确地理解和识别复杂的图像交互。
168 浏览量
154 浏览量
129 浏览量
285 浏览量
122 浏览量
201 浏览量
122 浏览量
285 浏览量
ycolourful
- 粉丝: 10
- 资源: 5