多模态特征融合在驾驶员注视区域估计中的应用

需积分: 5 31 浏览量更新于2024-08-03 收藏 1.38MB PDF 举报

"基于多模态特征融合的驾驶员注视区域估计，驾驶员注意力检测，驾驶员分神驾驶检测，DMS，汽车智能驾驶，智能座舱" 在智能驾驶领域，驾驶员的注意力状态是保障行车安全的关键因素之一。这篇论文由闫秋女和张伟伟撰写，主要探讨了如何在真实的驾驶环境中，通过多模态特征融合技术来估计驾驶员的注视区域，从而更好地理解和预测驾驶意图。这种方法旨在降低对额外硬件设备的依赖，使其更易于在实际驾驶场景中应用。传统的驾驶员注视估计方法通常依赖于复杂的眼部或面部传感器，这些设备可能不便于普及。而该论文提出的新方法包括以下步骤： 1. 遮挡净化人脸检测：使用特定的人脸检测器来识别和定位驾驶员的脸部，即使在部分遮挡的情况下也能准确捕捉。 2. 头部姿态估计：通过POSIT(Position and Orientation from Iterative Closest Points)算法，计算出驾驶员头部的姿态和特征，这有助于理解驾驶员的头部运动和可能的视线方向。 3. 3D人眼模型：基于2D关键点，利用3D人眼模型估计驾驶员的视线方向。这一步加强了对眼球运动的理解，提高了注视区域预测的准确性。 4. 多模态特征融合：结合头部姿态和人眼凝视方向的特征，通过改进的随机森林算法来预测驾驶员的注视区域。这种融合策略能够充分利用多种信息源，提升分类的精确度。实验结果显示，该方法在Columbia凝视数据集和ND-DB数据集中达到了92.5%的平均精度，对比同类方法，性能提升了至少6%。这意味着，对于防止因分心驾驶导致的事故，这一技术有着显著的潜力。智能座舱和汽车智能驾驶的发展，对驾驶员监控系统(DMS)的需求日益增强。驾驶员注意力检测和分神驾驶检测技术是这一领域的核心，它们能及时预警潜在的危险情况，提高驾驶安全性。通过多模态特征融合的驾驶员注视区域估计，不仅能帮助汽车系统更好地理解驾驶员的状态，还能为未来的自动驾驶系统提供关键的数据支持，实现更智能的驾驶辅助功能。

2022 年第 10 期计算机与数字工程

收稿日期：2022 年 3 月 9 日，修回日期：2022 年 4 月 21 日

作者简介：闫秋女，女，硕士研究生，研究方向：计算机视觉技术、智能交通系统和智能汽车。张伟伟，男，博士，副教

授，研究方向：图像处理技术、智能汽车和汽车动力总成。

∗

1 引言

分心驾驶是交通事故的一个重要原因

［1］

。导

致分心驾驶的主要原因有智能手机、驾驶场景、行

人及车载电脑等。随着现代电子技术的快速发展，

分心驾驶引起交通事故的概率逐渐增加

［2］

。近年

来，一些非侵入性司机的凝视检测和跟踪系统被提

出

［3］

。由于注视方向与头部姿态之间的密切关系，

许多方法都直接将头部方向作为衡量驾驶员注意

力的指标

［4］

。然而仅使用头位姿估计相邻区域的

效果较差。Tawari

［5］

等提出了增加眼睛特征可以显

著提高凝视区域的分类精度。Fridm an

［6］

等进一步

证明了仅移动眼睛时的凝视区域估计精度要高于

频繁移动头部时的凝视区域估计精度。因此，目前

基于多模态特征融合的驾驶员注视区域估计

∗

闫秋女张伟伟

（上海工程技术大学机械与汽车工程学院上海 201600）

摘要在驾驶自动化水平的不同阶段，驾驶员的注视对理解驾驶意图具有不可缺少的重要作用。传统的驾驶员注视

估计方法通常需要额外的设备来获取驾驶员的面部和眼睛特征，这很难广泛地应用到实际的驾驶场景中。论文对真实驾驶

场景下估计驾驶员人眼注视区域，并降低设备的硬件要求，提出了一种基于多模态特征融合的驾驶员注视区域估计的方

法。首先，使用论文提出的遮挡净化人脸检测器获取人脸及人脸关键点。然后采用 POSIT 算法对驾驶员头部姿态进行解算

并得到驾驶员头部特征。随后，基于 3D 人眼模型的方法由 2D 关键点估计驾驶员视线方向。最后，结合驾驶员头部姿态及

人眼凝视方向特征，利用改进的随机森林算法对注视区域进行估计。实验结果证明，该方法在 Columbia 凝视数据集和

ND-DB 数据集获得了 92.5%的平均精度，并与其他数据集上的同类方法相比，有不低于 6%的改进。

关键词驾驶员监控系统；多模态特征；注视区域估计；计算机视觉

中图分类号 U471.3 DOI：10. 3969/j. issn. 1672-9722. 2022. 10. 018

Estimation of Driver's Gaze Area Based on

Multi-modal Feature Fusion

YAN Qiunü ZHANG Weiwei

（Sch ool of Mechanical and Automotive Engin eering，Sha nghai University of Engineering Technology，Shangha i 201600）

Abstract In different stages of driving automation，driver's gaze plays an indispensable role in understanding driving inten⁃

tion. The traditional driver gaze estimation method usually needs additional equipment to obtain the driver 's face and ey e features，

which is difficult to be widely applied in the actual driving scene. This paper presents a method to est imate the driver's g aze area

based on multi-modal feature fusion in real driving scenarios and to redu ce the har dwa re requirements of the e quipment. Firstly，Oc⁃

clusion-immune face detector（OFD）is used to get the face and the key points of the face. Then POSIT algorithm is used to sol ve

the attitude of the driver's hea d and get the characteristics of the driver's head. T hen，based on 3D human eye model，2D key points

are used to estimate the d river's gaze direction. Finally，the im proved random forest algorithm is utili zed to estimate the fixation ar⁃

ea，which is combined wit h the driver's head pose and gaze direction. Experimental results show that this method has an average ac⁃

curacy of 92.5% in Columbia stares an d ND-DB data sets，and has an improve ment of no less than 6% compa red with similar meth⁃

ods in other data sets.

Key Words driver monitoring system，multi-modal feature fusion，gaze area estimation，computer vi sion

Class Number U471.3

总第 396 期

2022 年第 10 期

计算机与数字工程

Computer & Di gital Engineering

Vol. 50 No. 10

2217

下载后可阅读完整内容，剩余5页未读，立即下载

aixiao_xiaoo

粉丝: 105
资源: 62

多模态特征融合在驾驶员注视区域估计中的应用

多传感器数据融合的驾驶员状态判断

基于单目摄像头的驾驶员注视区域估计方法_冮俊冶.pdf

驾驶员注视区域估计算法研究_蔡晓洁.pdf

基于多模态信息融合的图像情感标注方法_唐智川.pdf

基于多模态融合的驾驶人愤怒情绪识别方法研究_毕业论文.pdf

多模态特征融合的遥感图像语义分割网络_孙汉淇.pdf

基于眼动与手部行为识别的驾驶分心检测算法研究_张樱己.pdf

基于无人机平台多模态数据融合的小麦产量估算研究_张少华.caj

SE_creation_with_NVHD.pdf

基于多模态融合的自动驾驶感知及计算.pdf

最新资源