基于Kinect传感器的两眼模型精确凝视估计方法

0 下载量 4 浏览量 更新于2024-08-27 收藏 1.06MB PDF 举报
"这篇研究论文探讨了如何使用Kinect传感器基于两眼模型进行精确且有效的凝视估计,即使在头部自由移动的情况下也能实现。作者提出了一种新的方法,包括使用两眼模型提高精度,改进的梯度中心定位3D空间中的虹膜中心,以及仅需一个校准点的新个人校准方法。该方法通过将视觉轴近似为从虹膜中心到凝视点的直线来确定眼球中心和Kappa角,从而计算出最终的凝视点。实验在11个受试者上验证了该方法,平均估计精度约为1.99度,优于许多现有的先进方法。" 本文的核心知识点如下: 1. **凝视估计**:这是一种技术,旨在确定一个人的视线方向,即他们正在注视的位置。这对于人机交互、心理分析、医疗诊断等领域有重要应用。 2. **Kinect传感器**:由微软开发的设备,主要用于捕捉人体运动和深度信息,常用于游戏和交互式应用。在本文中,它被用于获取用户的面部和眼睛数据。 3. **两眼模型**:该模型考虑了两个眼睛的位置和相互关系,以更准确地估计凝视点。这有助于纠正单眼模型可能引入的误差,尤其是在头部运动时。 4. **虹膜中心定位**:确定虹膜中心是凝视估计的关键步骤。文中提出的改进的卷积基梯度方法能够在3D空间中精确定位虹膜中心,提高了估计的准确性。 5. **个人校准**:传统的校准方法可能需要多个校准点,而本文提出的新方法只需要一个校准点,简化了校准过程,降低了用户参与的复杂性。 6. **Kappa角**:这是描述眼球旋转中心与瞳孔中心之间角度的术语,对理解眼球运动和正确计算视觉轴至关重要。 7. **视觉轴**:从虹膜中心到凝视点的直线代表了视线方向,是计算凝视点的基础。 8. **实验评估**:通过在11个受试者上进行实验,论文展示了所提方法的高精度和优越性,平均误差小于2度,证明了其在实际应用中的潜力。 这些知识点共同构成了基于Kinect传感器的两眼模型凝视估计方法,该方法不仅提高了估计精度,还降低了校准的复杂性,对于理解和改进人机交互技术具有重要意义。