人体行为识别:全局与局部特征融合的改进算法

2 下载量 132 浏览量 更新于2024-08-28 收藏 7.98MB PDF 举报
"该文提出一种改进的人体行为识别方法,结合全局和局部特征,针对HOG特征的局限性,采用方向可控滤波器增强局部边缘信息,并利用加速稳健特征和k-means聚类构建词袋模型,最终通过支持向量机进行行为分类。在KTH、UCF Sports和SBU Kinect Interaction数据集上的实验表明,该方法提高了识别准确率。" 本文主要探讨了基于全局和局部特征的人体行为识别技术,旨在解决传统方向梯度直方图(HOG)特征在识别中的局限性。HOG特征虽然能够捕捉到动作的全局梯度信息,但容易忽略局部细节,且对遮挡的处理效果不理想。为了改善这一情况,研究者提出了一种新的算法。 首先,该算法采用背景减法提取出人体运动区域,这有助于从复杂背景中准确地定位出活动主体。接着,引入了方向可控滤波器,这是一种能有效描述动作边缘特性的工具,它能够增强HOG特征的局部边缘信息,使特征更具描述力,尤其对于动作的细微变化更为敏感。 然后,研究者应用加速稳健特征(Speeded Up Robust Features, SURF)并对其进行k-means聚类,生成词袋模型(Bag-of-Words, BoW)。词袋模型是一种统计方法,可以将一组复杂的特征转换为可比较的向量形式,从而提高分类效率和准确性。通过这种方式,算法能够捕获更多的行为模式,增强了识别的鲁棒性。 最后,融合了全局和局部特征的行为特征被输入到支持向量机(Support Vector Machine, SVM)中进行分类。SVM是一种强大的监督学习模型,擅长处理小样本和高维数据,适合用于行为识别的分类任务。 实验结果在三个标准数据集KTH、UCF Sports和SBU Kinect Interaction上验证了该方法的有效性,识别准确率分别达到96.7%、94.2%和90.8%,显示出显著的性能提升。这些成果表明,结合全局和局部特征的方法在人体行为识别领域具有很大的潜力,对于提升复杂环境下的行为识别能力具有重要意义。