ICIoU:提升卷积神经网络边界框回归精度的关键策略

需积分: 41 11 下载量 125 浏览量 更新于2024-08-05 2 收藏 1.54MB PDF 举报
卷积神经网络(Convolutional Neural Network, CNN)在计算机视觉领域中的目标检测器因其简洁高效的特性备受青睐。然而,目标检测器的性能高度依赖于其定位算法的精度,特别是损失函数的选择。传统的损失函数如IoU(Intersection over Union)在衡量预测框与真实框重叠程度时,可能无法充分考虑预测框与真实框的形状匹配。因此,本文提出了一种改进的损失函数——Improved CIoU (ICIoU),它在原有Complete Intersection over Union的基础上进行了扩展。 ICIoU算法的关键在于它不仅考虑了预测框与真实框的面积重叠,还引入了预测框与真实框宽高比的匹配度。通过这种设计,当预测框与真实框的宽高比相同时,ICIoU能够更好地评估定位精度,从而强化了损失函数的惩罚作用,提高了模型的定位性能。相比于IoU,ICIoU在考虑形状匹配度的同时,有助于减少误报和漏报,尤其是在处理非矩形目标或目标部分遮挡的情况下。 作者们在Udacity、PASCAL VOC和MS COCO等数据集上进行了实验验证。结果显示,使用ICIoU作为YOLOv4单级目标检测器的损失函数,能够显著提升模型在精度方面的表现。在Udacity测试开发上,AP(平均精度)提高了1.92%,AP75(75%置信度下的精度)提升了3.25%,显示出ICIoU在定位精度优化方面的明显效果。在PASCAL VOC上,AP也有1.7%的提升,进一步证实了ICIoU在实际场景下提升性能的能力。 这项工作得到了陕西省工业自动化重点实验室的支持,研究结果表明,通过改进损失函数,可以有效提升基于CNN的目标检测器在复杂场景下的性能,对于深度学习和人工智能领域的研究具有重要意义。在未来的研究中,ICIoU可能会成为一种常用的损失函数选择,推动目标检测技术的进一步发展。