深度网络与RIG技术结合的眼中心定位方法

151 浏览量更新于2024-06-17 收藏 2.58MB PDF 举报

"这篇学术论文发表在沙特国王大学学报上，主要探讨了深度网络和矩形强度梯度（RIG）技术在眼中心定位中的应用。研究提出了一个综合方法，利用深度学习模型（如更快的RCNN和AlexNet）进行面部和眼睛检测，以及一种新的RIG技术来精准定位眼中心。实验结果显示，该方法在GI4E和BioID数据库上的表现优于现有先进方法，具有高准确性并表现出良好的鲁棒性。" 本文是关于计算机视觉领域的一个研究，特别是在眼睛中心定位方面的贡献。眼睛中心定位是多个关键应用的基础，包括人脸识别、凝视估计、驾驶员疲劳检测等。由于各种挑战，如面部姿态、遮挡、光照变化等，定位眼中心变得复杂。为了解决这些问题，研究者们提出了一个创新的综合解决方案。首先，他们采用更快的区域卷积神经网络（faster R-CNN）深度学习模型来检测面部和眼睛，这是一种高效的物体检测技术，能够处理不同尺度和位置的物体。接着，利用AlexNet进行眼睛开放状态的检测，AlexNet是预训练的深度学习模型，通过迁移学习可以快速适应新任务。然后，论文提出了矩形强度梯度（RIG）技术，这是本文的核心创新点，用于精确的眼中心定位。RIG技术可能通过对眼睛图像的局部特征分析，提供对眼中心更精确的定位。这种方法的优势在于它能够有效应对光照、镜面反射和角度变化等复杂情况。在GI4E和BioID这两个基准数据集上的实验表明，提出的RIG方法在极低的误差率下（Nerr≤0.05、0.10、0.25）取得了97.50%到99.64%的高准确率，显示出其在眼中心定位的卓越性能。此外，为了验证其鲁棒性，该方法还在AR和CAS-PEAL数据库上进行了测试，进一步证明了其在复杂条件下的稳定性和可靠性。这篇论文提出了一种结合深度学习与RIG技术的新方法，为眼睛中心定位提供了更高效、更准确的解决方案。这项工作不仅提升了计算机视觉领域的技术标准，也为相关领域的实际应用如自动驾驶安全、健康监测等提供了有力的技术支持。

放大图片作者：

Kuldeep Singh Yadav

，

M.Ahmed

等

沙特国王大学学报

7155

Fig. 1.

拟议工作的流程图。

然后基于图像注释/标记数据集，训练Faster RCNN用于人脸和眼睛检

测。检测精度与MATLAB Image Labeler中形成的图像注释/标记数据

集有关（Nguyen，2019）。这是一个手动过程，在制作标记数据集时

需要特别小心。剩余网络ResNet50被用作Faster RCNN深度学习模型

的基础网络所提出的方法跳过眼睛中心定位在闭上眼睛的状态。一个矩

形强度梯度的方法用于眼睛中心定位。

2.2.

预处理

本文在训练

Faster RCNN

模型进行人脸和眼睛检测之前使用了预

处理技术。预处理方法使数据库更适合检测（

Ahmed

和

Laskar

，

2019

）。图像增强使得所提出的模型对光照、尺度、旋转等具有更

强的鲁棒性直方图均衡化通过减少强度差异来改善图像的照明变化

（

Ahmed

和

Laskar

，

2021

）。直方图均衡化处理前后的图像如图

所示。二、在对象检测器模型的训练期间使用图像增强深度学习神

经网络的主要缺点是用于鲁棒深度学习模型的数据库的限制（

等

人，

2016

年）。在开发和训练模型之前，我们需要一个更通用的数

据库。现有的数据库不包含在比例，平移，旋转等方面的变化，因

此，在这项工作中，我们有

使用数据扩充技术来创建扩充数据，该扩充数据包括比例（从0到10像

素）、平移（从0到10像素）、旋转（10到10度）的变化。图像增强通

过旋转、移位、翻转等多种处理自动操纵现有数据库。它增加了训练数

据集中的变化数量，并自动提供不同变化的图像，使训练模型在测试阶

段对变化更加鲁棒（Fenget al.， 2020年）。

2.3.

使用

Faster RCNN

进行

本文提出了一种用于人脸和眼睛检测的快速

RCNN

模型更快的

RCNN

模型由两个模块组成，

DCNN

网络用作区域提议网络，然后

快速

RCNN

检测器（

Girshick

和

Fast

，

2015

）用于基于提议区域的

检测目的（

等人，

2016

年）。深度卷积神经网络（

DCNN

）

ResNet50

被用作基础网络（

Zhanget al.

，

2018

年）用于提取特征

图。区域建议网络（

RPN

）模块使用基于注意力的机制，并告诉

Faster RCNN

模块在哪里寻找（

Nguyen

，

2019

）。具有区域建议

网络的更快

RCNN

如图所示。

3 .

第三章。

区域提议网络从基础网络的最后一层获取卷积特征图，然后在图

像上生成区域提议（

等人，

2016

年）。区域提议网络预测对象

的概率（

Feng

等人，

2020

年）。非最大抑制将移除与其他

剩余14页未读，继续阅读

cpongm

粉丝: 6

深度网络与RIG技术结合的眼中心定位方法

基于局部优化的电动汽车充放电策略优化：MATLAB+CVX平台下的调度模型与效果分析,基于局部优化的电动汽车大规模随机充放电策略优化方案-对比均衡负载与全局优化法，实现运行成本最小化与高效出图效果

基于PLC控制的加工站与包装站间传送系统电气控制设计研究,PLC在加工传送包装站中的电气控制系统设计与应用,基于plc加工站传送包装站控制系统设计加工传送包装站电气控制 ,核心关键词：PLC加工站

2012年必应壁纸.rar

Zotero 重复合并 v1.1.5

基于DDS技术的FPGA信号发生器波形仿真：用Verilog语言实现正弦波、方波、锯齿波及三角波的组合生成,基于DDS技术的FPGA信号发生器波形仿真：Verilog语言实现正弦波、方波等四种波形及其

BIC调控超表面手性光响应：偏振转换、能带结构与复杂结构建模研究,基于BIC的超表面手性光响应：探索偏振转换与圆二色性CD谱特性，复杂结构建模及仿真研究，COMSOL与MATLAB联合应用,BIC支持

南充经济开发区（南充化工园区）智慧园区解决方案PPT(65页).pptx

基于SMO滑模观测器的异步电机无传感器矢量控制：Matlab仿真模型研究,基于SMO滑模观测器的异步电机无传感器矢量控制研究：Matlab仿真模型分析,基于SMO滑模观测器的异步电机无传感器矢量控制

使用ssh框架的文档管理系统.zip(毕设&课设&实训&大作业&竞赛&项目)

在 Python 中使用 TensorFlow 进行面罩检测

最新资源