深度学习驱动的眼中心定位：提升人脸识别鲁棒性和精度

137 浏览量更新于2024-06-17 收藏 2.58MB PDF 举报

本文主要探讨了眼中心定位在深度学习技术驱动的人脸识别应用中的重要性及其挑战。作者Naseem Ahmada、Kuldeep Singh Yadava、Manir Ahmed、Rounge Hussain Laskara和Ashraf Hossain来自印度的Cachar-788010（Silchar国家技术研究所）和海得拉巴CMR工程技术学院（ECE系），他们共同提出了一个综合的解决方案来提高眼中心定位的鲁棒性和准确性。研究的核心在于采用深度学习模型，特别是（i）更快的区域卷积神经网络（Faster R-CNN），该模型用于精确检测面部和眼睛区域。这种方法旨在处理面部姿势变化、遮挡、光照条件变化、镜面反射以及眼睛的旋转和尺度变化等问题，这些都是传统眼中心定位中的难点。进一步地，（ii）AlexNet被利用于转移学习来增强眼睛开放检测的能力，这有助于区分睁眼和闭眼状态。为了实现更精确的眼中心定位，研究引入了矩形强度梯度（RIG）技术，它利用图像的局部特征来计算眼中心位置。在实验阶段，研究人员在GI4E和BioID基准数据库上进行了详细的评估，结果显示，当误差容忍度分别为0.05、0.10和0.25时，他们的方法分别达到了97.50%、98.75%和99.64%的高精度。此外，鲁棒性的验证也在AR和CAS-PEAL数据库上进行，证明了新方法在保持准确性的同时，具有较强的抗干扰能力。与现有最先进的方法相比，所提出的策略在准确性和计算时间方面都表现出优势，这对于实时和可靠的面部分析应用至关重要。本文的工作不仅提升了眼中心定位的性能，还展示了深度学习在计算机视觉领域的广泛应用，特别是在人脸识别和相关生物测量任务中的关键作用。最后，值得注意的是，这篇研究是在沙特国王大学发表的开放获取文章，遵循CC BY-NC-ND 4.0许可协议，强调了学术合作和知识共享的重要性。整体来看，这项研究为解决眼中心定位问题提供了创新的技术路线，为未来计算机视觉和人脸识别技术的发展奠定了坚实的基础。

放大图片作者：

Kuldeep Singh Yadav

，

M.Ahmed

等

沙特国王大学学报

7155

Fig. 1.

拟议工作的流程图。

然后基于图像注释/标记数据集，训练Faster RCNN用于人脸和眼睛检

测。检测精度与MATLAB Image Labeler中形成的图像注释/标记数据

集有关（Nguyen，2019）。这是一个手动过程，在制作标记数据集时

需要特别小心。剩余网络ResNet50被用作Faster RCNN深度学习模型

的基础网络所提出的方法跳过眼睛中心定位在闭上眼睛的状态。一个矩

形强度梯度的方法用于眼睛中心定位。

2.2.

预处理

本文在训练

Faster RCNN

模型进行人脸和眼睛检测之前使用了预

处理技术。预处理方法使数据库更适合检测（

Ahmed

和

Laskar

，

2019

）。图像增强使得所提出的模型对光照、尺度、旋转等具有更

强的鲁棒性直方图均衡化通过减少强度差异来改善图像的照明变化

（

Ahmed

和

Laskar

，

2021

）。直方图均衡化处理前后的图像如图

所示。二、在对象检测器模型的训练期间使用图像增强深度学习神

经网络的主要缺点是用于鲁棒深度学习模型的数据库的限制（

等

人，

2016

年）。在开发和训练模型之前，我们需要一个更通用的数

据库。现有的数据库不包含在比例，平移，旋转等方面的变化，因

此，在这项工作中，我们有

使用数据扩充技术来创建扩充数据，该扩充数据包括比例（从0到10像

素）、平移（从0到10像素）、旋转（10到10度）的变化。图像增强通

过旋转、移位、翻转等多种处理自动操纵现有数据库。它增加了训练数

据集中的变化数量，并自动提供不同变化的图像，使训练模型在测试阶

段对变化更加鲁棒（Fenget al.， 2020年）。

2.3.

使用

Faster RCNN

进行

本文提出了一种用于人脸和眼睛检测的快速

RCNN

模型更快的

RCNN

模型由两个模块组成，

DCNN

网络用作区域提议网络，然后

快速

RCNN

检测器（

Girshick

和

Fast

，

2015

）用于基于提议区域的

检测目的（

等人，

2016

年）。深度卷积神经网络（

DCNN

）

ResNet50

被用作基础网络（

Zhanget al.

，

2018

年）用于提取特征

图。区域建议网络（

RPN

）模块使用基于注意力的机制，并告诉

Faster RCNN

模块在哪里寻找（

Nguyen

，

2019

）。具有区域建议

网络的更快

RCNN

如图所示。

3 .

第三章。

区域提议网络从基础网络的最后一层获取卷积特征图，然后在图

像上生成区域提议（

等人，

2016

年）。区域提议网络预测对象

的概率（

Feng

等人，

2020

年）。非最大抑制将移除与其他

剩余14页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

深度学习驱动的眼中心定位：提升人脸识别鲁棒性和精度

基于STM32单片机的激光雕刻机控制系统设计-含详细步骤和代码

白色简洁风格的前端网站模板下载.zip

HarmonyException如何解决.md

sdfsdfdsfsdfs222

(177373454)html+css+js学习代码.zip

usbgps2.apk

白色简洁风格的家居建材网站模板下载.zip

EventEmitError解决办法.md

白色简洁风格的工艺品展览企业网站源码下载.zip

matlab调制解调 OFDM OTFS 16qam qpsk ldpc turbo在高斯白噪声，频率选择性衰落信道下的误比特率性能仿真，matlab代码 OFDM simulink 包括添加保

最新资源