视频镜头检测与人体行为分析技术探析

需积分: 9 9 下载量 165 浏览量 更新于2024-07-23 收藏 6.83MB PDF 举报
"中山大学博士学位论文《视频镜头检测和人体行为分析》由吴娴撰写,指导教师为赖剑煌教授,专业为通信与信息系统。论文详细探讨了在计算机视觉领域中,人体运动的视觉分析,尤其是人体行为的检测与识别的重要性和挑战。文中总结了现有方法,介绍了相关行为数据库,评估了不同算法的性能,并提出了关键问题和发展趋势。" 在视频镜头检测部分,论文指出镜头检测是视频分析的基础,对于人体行为分析而言是一个重要的预处理步骤。传统的镜头检测方法基于低层特征如强度、颜色和形状,但容易出现漏检和误检问题,尤其在面对噪声和摄像机运动时。为解决这些问题,论文提出了一种基于空时显著性变化的统计方法。这种方法结合时间历史帧信息和空间信息生成显著图,通过观察空时显著性的变化来检测镜头间的差异,构建统计检测器以识别多种类型的镜头变化。实验证明,该方法在TREC01和不同类型视频上的表现优于传统方法。 在人体行为检测领域,论文提出了一种两阶段的策略,即“由粗到精”的匹配策略。在给定一个查询行为样本的情况下,该策略能在实际视频中有效地搜索并识别出与查询行为相似的行为。考虑到真实视频通常具有长时间跨度和复杂的背景,这种策略能够处理更复杂的行为检测任务,提高了检测的准确性。 至于人体行为识别,虽然论文没有深入详细介绍,但可以推测作者可能探讨了如何从低层次的运动检测、目标分类和跟踪过渡到高层次的行为理解。识别过程可能涉及到特征提取、模式匹配和机器学习技术,旨在对行为进行分类和描述。 总体而言,这篇博士论文对视频镜头检测和人体行为分析提供了新的理论和技术,不仅在理论层面有所贡献,还为实际应用提供了可行的解决方案。这些研究成果对于智能监控、安全防范、人机交互等多个领域具有重要价值。
2018-12-28 上传
计算机视觉通常是指计算机通过控制和应用传感器等设备对周围的环境进行获取的过程,然后对获取的视觉信息进行后期加工,包括表示、压缩、分析、处理、储存等,进而实现人类视觉所具有的“看”的功能。近年来计算机技术、光电技术和自动化技术的飞速发展,促成了计算机视觉系统的出现,同时随着人类生产生活需求的不断提高,视觉化、智能化的解决方案也越来越广泛的应用于工业生产、医疗和军事等领域,计算机视觉技术已经成为各国研究者关注和研究的热点。对计算机视觉系统的研究无论是在理论研究还是实际应用方面都有巨大的价值和意义。 基于图像的人体检测跟踪和人脸识别是当今计算机视觉和模式识别领域的热点研究问题,它在图像处理、智能监控、智能汽车等领域有着广泛的应用前景。本文针对人体检测跟踪和人脸识别中的一些关键问题进行研究,并取得了一定的进展,具体有如下四个方面:在人体检测方面,图像中复杂背景的变化对人体检测产生了负面的影响,比如产生空洞或者噪声,针对此类问题本文提出了基于二次连通域处理的人体检测方法,算法采用三帧差法提取运动目标,在得到二值图像后,运用数学形态学方法对二值图像进行膨胀腐蚀处理,接着利用四方向连接法和连通域三次扫描标记法去除空洞并连接断开的区域,最后利用HOG特征训练分类器来识别运动目标是否是人体。与传统方法不同的是,本文采用的四方向连接和连通域三次扫描标记法对于运动目标存在的空洞弥补效果更好,可以更加准确的连接断开区域,该方法对运动物体所在的环境没有约束,计算量较小,准确性高。实验结果表明,该方法是一种对于背景有一定鲁棒性的人体检测方法。 在人体跟踪方面,经典的Meanshift算法被广泛的用于计算机视觉和模式识别领域,但是当背景扰动的时候会使跟踪的准确性降低,针对此类问题本文提出了基于改进Meanshift的人体跟踪方法,算法通过判别跟踪区域是背景区域或前景区域来设置权重系数,进而实现定位更加准确的运动人体跟踪。与现有的方法相比,该方法减少了背景区域的计算量,同时将跟踪区域精确到运动人体,结合卡尔曼滤波器来预测运动人体下一步的方向,使得跟踪效果更好。实验结果表明,改进的方法相比传统Meanshift算法在准确度上要更加出色. 在光照预处理方面,由于光照对于人脸识别有重要的影响,比如高光、低光、单侧光等都会导致人脸识别率降低、误识率升高等一系列问题,所以本文提出了一种改进的高斯差分滤波光照预处理方法,通过改变高斯差分滤波器的水平方向和垂直方向的参