改进YOLOv5的水下群体目标检测:高精度与自适应策略

8 下载量 194 浏览量 更新于2024-06-26 1 收藏 4.55MB PDF 举报
本文主要探讨了基于改进的YOLOv5的水下群体目标检测技术,针对水下环境中的挑战,如目标模糊和遮挡问题,进行了深入研究和实现。研究的核心是DCM-ATM-YOLOv5模型,该模型融合了可变形卷积和自适应阈值机制。 首先,作者针对目标受模糊背景影响的问题,引入了可变形卷积模块。这个模块通过学习采样点的偏移,优化了特征采样策略,使得模型能够更专注于前景目标的检测,从而减少了背景对目标检测的干扰,显著提高了检测的准确性,达到了97.53%。 其次,针对高密度群体目标之间的相互遮挡导致的漏检问题,提出了自适应阈值模块。传统的固定阈值可能会忽略一些低置信度但实际存在的目标,通过预测自适应阈值,可以动态调整判断标准,有效避免了漏检,提升了召回率,最终达到98.09%。 此外,文章还介绍了KAYOLO模型,它进一步融合了先验知识来增强水下目标的特征提取。通过借鉴人类识别模糊目标时的推理策略,模型能够更好地处理目标模糊带来的特征丢失问题。同时,针对遮挡问题,KAYOLO采用了预测框聚合方法,通过合并同一目标的预测框,减少了不同目标间的干扰,进一步提高了召回率。 为了验证这些改进方法的有效性,研究者进行了详细的实验设计,包括消融实验、不同水下目标检测模型的性能对比实验以及模型鲁棒性测试。结果显示,相比于先进的水下目标检测模型,DCM-ATM-YOLOv5和KAYOLO在准确性与召回率上均有显著提升,证明了所提方法在实际应用中的优越性。 这篇硕士论文不仅解决了水下群体目标检测中的关键问题,而且通过实验验证了提出的改进策略的有效性,为精准的水下养殖监控提供了有力的技术支持。