深度学习驱动的眼中心定位:提升人脸识别鲁棒性和精度

0 下载量 137 浏览量 更新于2024-06-17 收藏 2.58MB PDF 举报
本文主要探讨了眼中心定位在深度学习技术驱动的人脸识别应用中的重要性及其挑战。作者Naseem Ahmada、Kuldeep Singh Yadava、Manir Ahmed、Rounge Hussain Laskara和Ashraf Hossain来自印度的Cachar-788010(Silchar国家技术研究所)和海得拉巴CMR工程技术学院(ECE系),他们共同提出了一个综合的解决方案来提高眼中心定位的鲁棒性和准确性。 研究的核心在于采用深度学习模型,特别是(i)更快的区域卷积神经网络(Faster R-CNN),该模型用于精确检测面部和眼睛区域。这种方法旨在处理面部姿势变化、遮挡、光照条件变化、镜面反射以及眼睛的旋转和尺度变化等问题,这些都是传统眼中心定位中的难点。进一步地,(ii)AlexNet被利用于转移学习来增强眼睛开放检测的能力,这有助于区分睁眼和闭眼状态。 为了实现更精确的眼中心定位,研究引入了矩形强度梯度(RIG)技术,它利用图像的局部特征来计算眼中心位置。在实验阶段,研究人员在GI4E和BioID基准数据库上进行了详细的评估,结果显示,当误差容忍度分别为0.05、0.10和0.25时,他们的方法分别达到了97.50%、98.75%和99.64%的高精度。此外,鲁棒性的验证也在AR和CAS-PEAL数据库上进行,证明了新方法在保持准确性的同时,具有较强的抗干扰能力。 与现有最先进的方法相比,所提出的策略在准确性和计算时间方面都表现出优势,这对于实时和可靠的面部分析应用至关重要。本文的工作不仅提升了眼中心定位的性能,还展示了深度学习在计算机视觉领域的广泛应用,特别是在人脸识别和相关生物测量任务中的关键作用。 最后,值得注意的是,这篇研究是在沙特国王大学发表的开放获取文章,遵循CC BY-NC-ND 4.0许可协议,强调了学术合作和知识共享的重要性。整体来看,这项研究为解决眼中心定位问题提供了创新的技术路线,为未来计算机视觉和人脸识别技术的发展奠定了坚实的基础。
2024-12-26 上传