深度学习驱动的多视窗SSD:提升小目标检测性能

需积分: 9 9 下载量 113 浏览量 更新于2024-09-12 1 收藏 1.26MB PDF 举报
本文主要探讨了一种基于深度学习的多视窗Single Shot Multibox Detector (SSD) 目标检测方法。作者唐聪、凌永顺等人在国防科技大学的研究背景下,针对经典SSD在处理小目标检测时存在的问题,深入分析了卷积神经网络(CNN)的卷积感受野(receptive field)在不同层级的特点以及它们对原始图像的映射关系。他们发现,经典SSD由于默认框大小与小目标实际尺寸不匹配,导致在小目标检测中的性能受限。 为了克服这一问题,研究者提出了多视窗SSD模型。这个模型的关键在于设计了多个窗口大小,针对不同尺度的目标进行检测,从而扩大了对小目标的覆盖范围。每个窗口对应一个特定的特征层,这样可以更精确地定位和识别小目标。多视窗SSD的工作原理是通过并行处理这些窗口来捕捉不同大小的目标,同时结合深度学习的卷积层和非极大抑制(NMS)策略,提高了检测精度。 实验部分,作者使用了106张包含小目标的图像数据集进行了详细的评估和对比。结果显示,在置信度阈值为0.4的情况下,多视窗SSD方法在平均F-measure (AF) 上达到了0.729,mean Average Precision (mAP) 达到了0.644,相比于经典SSD分别提高了0.169和0.131。这些提升的数据表明,他们的多视窗SSD方法在小目标检测任务上具有显著的优势,验证了所提出的算法的有效性和实用性。 关键词包括深度学习、多视窗SSD、目标检测和小目标检测。该研究对于提高计算机视觉中的目标检测性能,特别是在处理小目标场景时,具有重要的理论价值和实际应用前景。研究成果发表在《红外与低温等离子体》杂志,引用了DOI:10.3788/IRLA201847.0126003,表明了其在学术界的认可度。