改进的轨迹行为识别:考虑相机运动

需积分: 10 14 下载量 49 浏览量 更新于2024-09-12 收藏 2.48MB PDF 举报
"Action Recognition with Improved Trajectories - ICCV 2013" 本文是2013年在国际计算机视觉大会(ICCV)上发表的一篇关于行为识别的经典研究,主要探讨了如何通过改进轨迹跟踪技术来提高行为识别的准确性。作者Heng Wang和Cordelia Schmid来自法国INRIA的LEAR实验室。 在视频分析领域,密集轨迹已被证明是一种有效的视频表示方法,能够取得在多个数据集上的最优识别效果。然而,该论文旨在进一步提升这些轨迹的性能,尤其是考虑了相机运动对轨迹的影响并对其进行校正。作者提出了一种新的方法,结合SURF特征点匹配和密集光流估计来检测相机运动。SURF(Speeded Up Robust Features)是一种鲁棒的特征描述符,而密集光流则能捕捉帧间的像素级运动信息。这两种方法互补,共同用于计算匹配关系。 匹配得到的特征点随后用于随机抽样一致性(RANSAC)算法,以稳健地估计 homography(相似变换),即相机的运动模型。然而,由于人类运动与相机运动通常不同,会导致不一致的匹配。因此,论文引入了人体检测器,以移除这些由相机运动引起的不匹配特征。 在相机运动得到估计后,研究者删除了与之相符的轨迹,这有助于减少噪声干扰。此外,他们还利用这个估计值消除光流中的相机运动影响,从而显著提升基于运动的描述符,如Histogram of Optical Flow (HOF)和Motion Boundary Histogram (MBH)的性能。实验结果显示,这种方法在四个具有挑战性的行为数据集——Hollywood2、HMDB51、Olympic Sports和UCF50上取得了显著的识别效果提升。 这篇论文提出了一个集成相机运动校正和轨迹优化的框架,增强了行为识别的准确性和鲁棒性,对于视频理解与监控、智能安全等领域具有重要的理论与实践价值。