人体动作行为识别:在线字典学习与特征提取

需积分: 0 53 下载量 16 浏览量 更新于2024-08-20 收藏 5.31MB PPT 举报
本论文主要探讨了视频中人体动作行为的识别技术,利用在线字典学习的方法来提升识别准确性和效率。论文首先介绍了背景,强调了研究的重点在于构建PM-PEMO时空金字塔特征,这是一种关键的特征构造方法,它能够捕捉目标物体的全局运动信息、宏观运动状态、运动趋势以及边缘轮廓和细节信息。时空金字塔结构有助于处理不同尺度和时间维度的信息,提高特征表示的鲁棒性。 论文接着阐述了人体动作行为特征的学习和训练过程,通过机器学习与模式识别的技术,如光流方法(包括均值滤波、中值滤波、差分图像梯度等)、双帧和三帧差分统计累积量、以及各种运动特征提取方法(如运动梯度、光流特征、边缘梯度和像素变化特征),来提取视频中的有效信息。例如,像素变化概率图被用来表示动作的连续性和可能性,有助于区分不同的行为。 光流是论文中的一个重要概念,它是由于连续帧之间像素亮度的变化而产生的运动矢量场,用于估计目标的运动。论文通过比较去噪前后像素变化概率图的差异,展示了其在去噪和增强特征表现上的作用。图3-2给出了一个实际应用的例子,展示了跑步行为视频中像素变化比率图(PCRM)和经过处理后的像素变化概率图(PCPM)的对比。 此外,论文还提到了行为识别软件系统的开发,这包括了整个识别框架的设计,旨在将上述特征分析与实际应用相结合,实现对视频中人体动作行为的实时或近实时识别。传统的识别方法与论文提出的创新方法进行了对比,突出了该研究的独特贡献。 总结来说,本论文通过对视频中人体动作行为的深入研究,尤其是时空金字塔特征的构建和多种特征提取技术的应用,为视频行为识别提供了强有力的方法论支持,具有较高的实用价值和理论意义。