深度图像人脸识别:协方差矩阵与黎曼流形方法

需积分: 15 1 下载量 28 浏览量 更新于2024-09-07 收藏 1.34MB PDF 举报
"这篇论文研究的是深度图像集的鲁棒人脸识别技术,主要涉及深度图像、人脸识别、图像集、协方差矩阵法和黎曼流形等核心概念。论文提出了一种新的方法,通过使用Kinect设备捕获的原始深度数据进行姿态估计和人脸区域裁剪,提高了人脸识别的鲁棒性。" 在深度图像人脸识别领域,传统方法常常面临姿态变化、光照条件和遮挡等因素带来的挑战。针对这些问题,该研究创新地提出了一种基于协方差矩阵法的表示方式。首先,论文将多幅由Kinect设备获取的深度图像组合成一个图像集,并对这些图像进行4×4的块划分。这样做是为了更好地捕捉图像内部的局部特征和全局结构。 接着,研究者将图像集按照姿态信息划分为c个图像子集,每个子集内的图像共享相似的姿势特性。然后,每个子集的图像块用协方差矩阵进行表示,这是因为协方差矩阵能够反映像素之间的统计关系,从而对姿态变化和局部变形具有一定的鲁棒性。在黎曼流形上,这些协方差矩阵被进一步处理,以便在非欧几里得空间中进行分析。黎曼流形是一种数学工具,用于描述曲面或高维空间,非常适合处理这种非线性的数据结构。 为了实现分类,每个图像子集在黎曼流形上独立学习支持向量机(SVM)模型。SVM是一种强大的分类器,能有效地处理高维数据,找到最优的决策边界。同时,论文还引入了一种融合策略,以整合所有图像子集的分类结果,增强了整体的识别性能。 实验部分,该方法在CurtinFaces、Biwi Kinect和UWA Kinect这三个最大的公开Kinect人脸数据集上进行了验证。结果表明,相较于其他先进方法,该方法在识别率上有显著提高,且标准差保持较低,显示出了对图像集大小、子集划分数量和空间分辨率的良好鲁棒性。 总结来说,这篇论文提出的深度图像人脸识别方法通过结合协方差矩阵法和黎曼流形理论,提供了一种有效的解决姿态变化引起的识别问题的方案。这种方法不仅提高了识别精度,而且在实际应用中对各种参数变化有较好的适应性,具有重要的理论和实践价值。