显著鲁棒轨迹在自然环境行为识别中的应用

2 下载量 134 浏览量 更新于2024-08-27 收藏 4.33MB PDF 举报
"本文提出了一种在自然环境视频中基于显著鲁棒轨迹的行为识别算法,旨在解决背景复杂、摄像机抖动等因素导致的行为识别难题。该算法利用稠密光流技术跟踪多尺度空间中的显著特征点,并结合HOG、HOF和MBH特征描述显著轨迹。同时,通过自适应背景分割的摄像机运动估计技术来增强轨迹的鲁棒性,以抵消摄像机运动的影响。使用Fisher Vector模型将视频转化为Fisher向量,再用线性支持向量机进行分类。实验证明,这种方法在Hollywood2、YouTube、Olympic Sports和UCF50四个公开数据集上的性能优于现有最佳方法,提高了识别准确率。" 在计算机视觉领域,人类行为识别是一项核心任务,特别是在自然环境视频中,由于背景的复杂性和摄像机的不稳定性,行为识别面临着诸多挑战。本文提出的算法创新地运用了显著鲁棒轨迹,以提高识别的准确性和稳定性。首先,它采用稠密光流技术,这是一种用于捕捉图像序列中像素级运动的方法,能够在多尺度空间内追踪到显著特征点,这些点通常对应于行为中的关键动态元素。 接着,算法使用三种特征描述符——梯度直方图(HOG)、光流直方图(HOF)和运动边界直方图(MBH),这些特征在描述物体运动和形状变化方面表现出色,特别适合于行为识别。显著轨迹的构建使得算法能更专注于重要的运动信息,而忽略背景干扰。 为了进一步增强轨迹的鲁棒性,算法引入了基于自适应背景分割的摄像机运动估计技术。这有助于消除因摄像机运动造成的失真,确保跟踪的稳定性和准确性。之后,Fisher Vector编码被用来将每个视频转化为具有区分性的Fisher向量,这种编码方式可以有效地捕获局部特征的分布信息。最后,线性支持向量机作为分类器,对视频进行分类,以判断其中包含的行为类别。 实验结果在四个标准数据集上验证了该算法的有效性,其性能优于现有的Dense轨迹算法和显著轨迹算法,尤其是在Hollywood2、YouTube、Olympic Sports和UCF50数据集上,识别准确率有显著提升。这一成果表明,基于显著鲁棒轨迹的行为识别算法在复杂自然环境视频中具有很好的应用潜力,有望推动计算机视觉在行为识别领域的进步。