创新PM-PEMO特征:视频人体动作行为识别方法与应用

需积分: 0 53 下载量 17 浏览量 更新于2024-08-20 收藏 5.31MB PPT 举报
本硕士论文主要探讨了视频中的人体动作行为识别技术,这是一个结合了创新方法和实际应用的领域。论文的核心内容分为两大部分:方法的创新和方法的应用。 在方法创新部分,作者提出了一种新的特征描述子PM-PEMO,它是一种时空金字塔特征构造。这个特征具有显著的优势,包括全局运行信息和局部运动信息的双重表达,使得它具有很强的抗干扰和抗噪声能力,对模糊和噪声数据具有较高的鲁棒性。PM-PEMO的特点包括: 1. 全局运动信息:它能够反映出目标在整个视频序列中的整体运动趋势。 2. 宏观运动状态:它能体现运动目标的大致运动方向和状态。 3. 运动趋势:通过分析连续帧的变化,捕捉动态行为的演变。 4. 边缘轮廓信息:有助于区分不同的身体部分和动作细节。 5. 运动细节:虽然强调全局,但也能捕捉到局部的微小动作变化。 6. 适度复杂性:确保从视频中提取的特征数量恰到好处,避免冗余或丢失关键信息。 另一方面,论文还介绍了将机器学习和模式识别的先进技术应用到行为识别中的实践。这可能涉及到各种技术,如: - 光流:通过比较连续帧之间的像素变化来估计物体的运动,是常见的运动特征提取手段。 - 边缘检测:用于提取图像中的边界信息,这对于识别动作的关键点至关重要。 - 像素变化特征:计算帧间差异,反映物体的移动或形状变化。 - 光流方法:包括基于梯度、匹配、能量或相位的方法,以及神经动力学方法,这些都是计算运动特征的不同策略。 - 噪声处理:如均值滤波、中值滤波和去噪,以提高特征的质量和识别的准确性。 论文还展示了具体的应用实例,如利用KTH数据库中的跑步行为视频,通过分析像素变化比率图(PCRM)和去噪后的像素变化概率图(PCPM),来提取和识别人体动作。图3-2提供了这些分析的视觉展示,对比了原始帧、像素变化图和去噪后的结果,直观地说明了特征提取和识别的过程。 这篇论文深入探讨了如何构建有效的特征描述器,结合先进的机器学习技术,解决视频中人体动作行为的识别问题,展示了理论研究与实际应用的有效融合。