YOLOv7驱动的无人机实时热红外人体检测:精度与速度优化

版权申诉
0 下载量 42 浏览量 更新于2024-08-03 收藏 2.01MB PDF 举报
本文主要探讨了在无人机遥感领域中利用计算机视觉技术实现热红外(TIR)图像和视频的人体实时检测问题。对象检测是计算机视觉和遥感中的核心挑战,尤其是在无人机生成的TIR多场景照片和视频中,由于目标尺寸小、场景复杂、分辨率相对较低且标注数据稀缺,这使得传统的目标检测任务面临严峻的挑战。 作者针对这一问题,提出了一个基于卷积神经网络(CNN)架构的"你只看一次"(YOLO)模型,具体采用了YOLOv7版本,这是一种先进的目标检测算法。YOLOv7以其高效性和准确性著称,它能够在处理实时视频流时达到很高的检测精度。实验结果显示,在验证任务中,对于人体目标检测,YOLOv7的平均精度达到IOU(交并比)为0.5的情况下,准确率达到了72.5%,同时保持了相对较高的检测速度,大约为每秒161帧(FPS)。 论文详细介绍了YOLOv7在无人机TIR视频中对人体检测的性能评估,特别是在不同无人机视角下的跨视角检测能力。这种应用证明了YOLO架构在解决遥感数据中目标检测问题的实用性,特别是在缺乏大量标记数据集和训练模型的条件下。通过定性和定量评估,研究人员得出了深度学习模型在TIR图像和视频目标检测领域的积极效果,这对于推动公共安全监控和无人机技术的发展具有重要意义。 这篇研究为解决无人机热红外遥感数据中的人体检测问题提供了一个创新的方法,展示了深度学习在解决实际应用场景中的强大潜力,同时也为其他类似领域的研究者提供了有价值的参考模板和数据集使用指南。