仿射包与伪Zernike矩在视频人脸检索中的应用

需积分: 0 0 下载量 103 浏览量 更新于2024-09-05 收藏 649KB PDF 举报
“论文研究-基于仿射包和伪Zernike矩的视频人脸检索.pdf”主要探讨了一种用于视频人脸检索的新算法——FRIVAP(Face Retrieval in Video based on Affine Hull and Pseudo-Zernike Moments)。该算法结合了仿射包理论和伪Zernike矩特征提取技术,旨在处理视频中的人脸检索问题,尤其在噪声、姿态变化等复杂条件下表现出良好的鲁棒性。 正文: 在人脸识别和检索领域,基于视频的人脸检索是当前的研究热点。这一技术主要应用于多媒体视频,如监控视频和新闻视频,目的是在视频中查找与给定人脸相似或相同的图像或片段。区别于人脸识别,人脸检索并不需要确切的身份信息,而是寻找相貌相似的面部。这一研究对于图像处理、模式识别、计算机视觉以及视频检索和监控等领域具有深远的理论意义和实际应用价值。 近年来,学者们提出了多种视频中的人脸检索和识别方法。例如,Zhao等人结合多源信息(文本、图像、视频)进行网络视频中的人脸识别;Fischer等人开发了一种交互式人脸检索系统,允许用户选择一个视频中的人脸,然后系统会在其他视频中搜索同一人物的片段;而Zhou等人则运用贝叶斯理论和时间序列模型来描述人脸的动态变化,以进行人脸识别。 本文提出的FRIVAP算法,首先在视频中检测和跟踪人脸,生成一系列人脸图像。然后,提取这些图像中人脸的伪Zernike矩特征。伪Zernike矩是一种描述形状和结构的有效数学工具,尤其适用于处理非圆形或非对称形状,它能捕获人脸的关键几何特性。接着,这些特征被整合到一个仿射包中。仿射包是多维空间中一组点的最大凸包,它能够包容所有特征点并保留它们之间的相对位置关系,从而考虑了人脸在视频中的时空变化。 通过计算待查询人脸特征与仿射包内人脸特征的相似度,可以确定两者的匹配程度。这种方法利用了视频中人脸的时间连续性和空间变化,提高了检索的准确性。实验在Honda/UCSD视频数据库以及自建数据库上进行了验证,结果表明,FRIVAP算法在噪声环境和不同姿态变化下仍能保持较高的检索性能。 总结来说,"基于仿射包和伪Zernike矩的视频人脸检索"这一研究创新地将仿射包和伪Zernike矩相结合,提高了视频人脸检索的鲁棒性和效率,为视频监控、安全、娱乐等多个领域提供了更高效、更准确的解决方案。