YOLOv4-D与YOLOv4-P:改进的目标检测方法

需积分: 0 3 下载量 180 浏览量 更新于2024-06-26 1 收藏 2.59MB PDF 举报
"这篇专业学位硕士论文探讨了基于YOLOv4的目标检测方法,主要针对YOLOv4在深层和浅层信息特征提取以及信息利用率上的不足进行了改进,提出两种新方法:YOLOv4-D(扩张坐标注意力)和YOLOv4-P(改进的路径聚合和池化)。YOLOv4-D通过引入扩张卷积和扩张坐标注意力模块,增强了浅层特征提取能力,同时采用多尺度训练策略提高模型的鲁棒性。YOLOv4-P则改进了路径聚合网络,增加了检测层以更好地融合浅层特征。实验结果显示,这两种改进方法在检测精度上均优于原始YOLOv4和其他先进目标检测方法。" YOLOv4是一种广泛应用于目标检测的一阶段算法,它在保持较快的检测速度的同时,也能够达到较高的检测精度。然而,YOLOv4在处理深层和浅层信息特征时可能存在不足,导致特征提取不够全面,且信息利用率不高。论文作者针对这些问题进行了深入研究,提出了两个创新性的解决方案。 首先,YOLOv4-D(YOLOv4 with Dilation Coordination Attention)旨在改善YOLOv4的浅层特征提取。通过引入扩张卷积,论文作者创建了一个扩张坐标注意力模块,它能够处理不同扩张率的特征,将不同感受野下的特征映射融合在一起,从而显著提升了浅层网络的特征提取能力。此外,多尺度训练策略的运用进一步增强了模型对不同大小目标的适应性和鲁棒性。 其次,YOLOv4-P(YOLOv4 with Path Aggregation and Pooling)着重于提高YOLOv4的信息利用率。通过对路径聚合网络的改进,特别是在主干特征提取网络的第二个残差块处添加一个新的检测层,YOLOv4-P有效地防止了信息丢失,增强了特征的融合,尤其是浅层特征的利用。 实验部分,作者在PASCAL VOC 2007和VOC 2012数据集上验证了这两种改进方法的有效性。实验结果表明,YOLOv4-D和YOLOv4-P不仅在检测速度上接近原始YOLOv4,而且在精度上明显优于YOLOv4和其他现有目标检测算法,这为未来的目标检测研究提供了有价值的参考。