鲁棒非侵入式眼睛定位:应对不同姿态、尺度与光照

0 下载量 5 浏览量 更新于2024-08-30 收藏 1014KB PDF 举报
"文章探讨了在不同的眼部姿势、尺度和照明条件下的眼睛定位技术,提出了一种基于修正的Hausdorff距离的测量方法,该方法能够容忍眼部的各种变化。同时,为了消除光照变化的影响,文章提出了一种8邻域灰度变换,这种变换使图像对光照变化不那么敏感,但仍然保留了眼睛的外观信息。通过反向传播神经网络,可以识别所有眼睛的候选位置。实验表明,这种方法能够有效地在不同的大小、形状和姿势以及各种光照条件下定位眼睛。" 本文主要关注的是计算机视觉领域的一个重要问题——人眼定位,特别是在不同的眼部状态和环境光照条件下。作者Jinghe Yuan提出了一种新的、鲁棒的非侵入式眼睛定位策略,这对于基于视觉的人机交互具有重要意义。 首先,文章介绍了针对眼部姿态、形状和尺寸变化的修正Hausdorff距离的测量方法。Hausdorff距离是一种衡量两个点集之间最大距离的度量,在这里被用来定位眼睛。通过修改这个距离度量,算法可以适应眼睛的各种变化,增强了定位的稳定性。 其次,为了解决光照变化带来的影响,作者提出了一个8邻域的灰度图像变换方法。这种变换可以减少光照变化对图像的敏感性,同时保持眼睛的特征信息,使得在不同光照环境下,眼睛的特征仍能被有效识别。 最后,论文采用反向传播神经网络来识别经过变换后的图像中的眼睛候选区域。反向传播神经网络是一种常用的机器学习模型,它可以从训练数据中学习并进行模式识别,尤其适合处理复杂的图像识别任务。 通过实验验证,这种方法在不同的眼睛大小、形状、姿势以及多种光照条件下都能有效地进行眼睛定位,这表明了其在实际应用中的广泛潜力。文章的OCIS代码涉及的领域包括生物医学光学(150.1135)、图像处理(100.2000)和视觉系统(100.3008),反映了文章研究内容的跨学科性质。 这项工作提供了一种新的、适应性强的眼睛定位技术,对于提升人机交互系统的性能,尤其是在复杂环境中的应用,具有重要的理论与实践价值。