深度学习驱动的抽烟打电话行为检测与识别技术
需积分: 5 87 浏览量
更新于2024-06-13
收藏 9.24MB PDF 举报
"这篇论文是赵绪言于2019年在西南交通大学攻读硕士学位期间完成的研究,主题聚焦于基于深度学习的抽烟打电话动作识别。该研究关注于驾驶员注意力检测,特别是在汽车智能驾驶和智能座舱的背景下,对驾驶员分神驾驶行为的识别具有重要意义。论文探讨了如何在深度学习技术的帮助下,改善在复杂场景中对抽烟和打电话动作的识别效果。
论文指出,尽管现有的深度学习方法在人脸识别和动作识别方面已取得显著进步,但在实际应用中,尤其是在视角变化、尺度变换大的情况下,小目标如香烟和电话的检测仍存在挑战。此外,抽烟和打电话可能同时发生,单一的二分类方法无法准确捕捉这种复杂行为。因此,作者将动作识别问题分解为两个阶段:疑似目标定位和动作交互识别。
在疑似目标定位阶段,论文提出了空间信息增强的双路金字塔网络,通过图像金字塔增强对纹理细节的捕获能力,并设计了空间信息增强模块以减少非相关区域的干扰,提高小目标检测的精度。
在动作交互识别阶段,论文引入了结构聚类引导模块,利用人与物体交互的先验知识来区分和定位抽烟、打电话的行为。这一方法旨在更准确地理解并识别出这两个可能同时存在的动作,以适应不同场景下的规则和容忍度。
这篇论文为驾驶员注意力检测提供了创新的解决方案,有助于提高汽车智能驾驶的安全性,减少因分神驾驶导致的交通事故。"
2020-10-15 上传
2022-11-29 上传
2023-09-05 上传
2021-11-07 上传
2021-07-06 上传
2021-10-29 上传
aixiao_xiaoo
- 粉丝: 100
- 资源: 62
最新资源
- 单片机串口通信仿真与代码实现详解
- LVGL GUI-Guider工具:设计并仿真LVGL界面
- Unity3D魔幻风格游戏UI界面与按钮图标素材详解
- MFC VC++实现串口温度数据显示源代码分析
- JEE培训项目:jee-todolist深度解析
- 74LS138译码器在单片机应用中的实现方法
- Android平台的动物象棋游戏应用开发
- C++系统测试项目:毕业设计与课程实践指南
- WZYAVPlayer:一个适用于iOS的视频播放控件
- ASP实现校园学生信息在线管理系统设计与实践
- 使用node-webkit和AngularJS打造跨平台桌面应用
- C#实现递归绘制圆形的探索
- C++语言项目开发:烟花效果动画实现
- 高效子网掩码计算器:网络工具中的必备应用
- 用Django构建个人博客网站的学习之旅
- SpringBoot微服务搭建与Spring Cloud实践