深度学习驱动的抽烟打电话行为检测与识别技术

需积分: 5 0 下载量 87 浏览量 更新于2024-06-13 收藏 9.24MB PDF 举报
"这篇论文是赵绪言于2019年在西南交通大学攻读硕士学位期间完成的研究,主题聚焦于基于深度学习的抽烟打电话动作识别。该研究关注于驾驶员注意力检测,特别是在汽车智能驾驶和智能座舱的背景下,对驾驶员分神驾驶行为的识别具有重要意义。论文探讨了如何在深度学习技术的帮助下,改善在复杂场景中对抽烟和打电话动作的识别效果。 论文指出,尽管现有的深度学习方法在人脸识别和动作识别方面已取得显著进步,但在实际应用中,尤其是在视角变化、尺度变换大的情况下,小目标如香烟和电话的检测仍存在挑战。此外,抽烟和打电话可能同时发生,单一的二分类方法无法准确捕捉这种复杂行为。因此,作者将动作识别问题分解为两个阶段:疑似目标定位和动作交互识别。 在疑似目标定位阶段,论文提出了空间信息增强的双路金字塔网络,通过图像金字塔增强对纹理细节的捕获能力,并设计了空间信息增强模块以减少非相关区域的干扰,提高小目标检测的精度。 在动作交互识别阶段,论文引入了结构聚类引导模块,利用人与物体交互的先验知识来区分和定位抽烟、打电话的行为。这一方法旨在更准确地理解并识别出这两个可能同时存在的动作,以适应不同场景下的规则和容忍度。 这篇论文为驾驶员注意力检测提供了创新的解决方案,有助于提高汽车智能驾驶的安全性,减少因分神驾驶导致的交通事故。"