Bi-SSD算法:提升小目标检测性能的新方法

需积分: 37 11 下载量 161 浏览量 更新于2024-08-13 5 收藏 1.19MB PDF 举报
"本文介绍了一种改进的单次多框检测器(SSD)——双向单次多框检测器(Bi-SSD),用于解决小目标检测的问题。Bi-SSD通过设计小目标特征提升模块和结合多尺度特征融合的BiFPN结构,提高了小目标的检测性能。在PASCAL VOC和MS COCO数据集上的实验结果显示,Bi-SSD相比于原始SSD有显著的提升,尤其是在mAP指标上。" 正文: 小目标检测是计算机视觉领域的一个挑战性任务,由于小目标在图像中的尺寸小,容易被背景淹没,使得传统的目标检测算法难以准确地定位和识别。SSD(Single Shot multibox Detector)是一种高效的一阶段目标检测框架,它通过同时进行分类和定位预测,简化了目标检测流程。然而,SSD在处理小目标时表现相对较弱,这主要是因为其低层特征图的分辨率不足以捕捉小目标的细节。 为了解决这个问题,研究者们提出了Bi-SSD(Bi-directional Single Shot multibox Detector),这是一种基于SSD的改进模型,专门针对小目标检测。Bi-SSD的核心创新在于两个方面:小目标特征提升模块和双向特征金字塔网络(BiFPN)。 首先,小目标特征提升模块设计用于增强SSD的浅层特征,这些特征通常包含了更多的位置信息,但对小目标的细节表示不足。通过这个模块,可以提升浅层特征对小目标的识别能力,使其在保持高定位精度的同时,也能捕获到足够的目标信息。 其次,BiFPN是一种多尺度特征融合的方法,它借鉴了FPN(Feature Pyramid Network)的思想,但增加了双向信息传递,即上下层特征不仅可以自上而下传递,也可以自下而上传递。这样的设计使得高层特征能够获取到更多的低层空间信息,而低层特征也能获得高层语义信息,从而更有效地处理多尺度的目标,特别是小目标。 在实验部分,Bi-SSD在PASCAL VOC和MS COCO这两个广泛使用的检测数据集上展示了其优越性。在VOC2007+2012上,Bi-SSD的平均精度(mAP)达到了78.47%,比原版SSD提升了1.34个百分点,而在更为复杂的COCO2017数据集上,mAP提升至26.4%,提高了接近2.4%。这些提升显示了Bi-SSD在小目标检测上的显著优势。 Bi-SSD通过特征增强和多尺度信息融合,有效地提升了小目标的检测性能,为深度学习和卷积神经网络在目标检测领域的应用提供了新的思路。这种改进对于解决现实世界中的小目标检测问题,如监控视频分析、遥感图像识别等,具有重要的实践意义。