YOLO v5s-CBD: 提升植物识别的轻量化模型

9 下载量 117 浏览量 更新于2024-08-03 1 收藏 1.44MB PDF 举报
"这篇论文由马宏兴等人撰写,发表在《农业机械学报》上,探讨了基于改进YOLO-v5s的轻量化植物识别模型。针对原YOLO-v5s模型在处理复杂背景下的植物识别问题,研究团队提出了YOLO-v5s-CBD模型。该模型引入了Transformer模块的BoTNet主干网络,结合卷积和自注意力机制,增强了模型对全局信息的捕捉能力。同时,模型还融合了坐标注意力机制,提升了对通道和位置信息的敏感性。为了优化模型结构并减小其体积,YOLO-v5s-CBD应用了深度可分离卷积。实验结果显示,该模型在Nvidia GTX A5000 GPU上的运行帧率为140帧/s,模型大小为8.9MB,取得了高精度、高召回率和高F1分数,显示了出色的植物识别性能。" 在当前的植物识别领域,快速准确地识别不同种类的植物对于环境监测、生态保护以及农业生产和研究至关重要。YOLO (You Only Look Once) 是一种实时目标检测系统,尤其适用于实时场景。YOLO-v5s 是YOLO系列的一个变体,以其高效和高精度而被广泛采用。然而,YOLO-v5s 在处理复杂背景时可能遇到挑战,其较大的参数量也可能影响到模型的部署和计算效率。 论文中提出的YOLO-v5s-CBD模型进行了多方面的改进,以适应复杂的植物识别任务。首先,引入Transformer模块的BoTNet作为特征提取网络的一部分,Transformer的自注意力机制能够处理长距离依赖,增强模型对全局信息的理解。其次,坐标注意力机制(Coordinate Attention, CA)的加入,使得模型能够更好地理解目标的位置信息,这对于植物识别这类需要精细定位的任务尤其重要。此外,使用SIoU函数改进了损失函数,解决了预测边界框与真实边界框的匹配问题,提高了定位的准确性。 深度可分离卷积(Depthwise Separable Convolution, DSC)是轻量化模型的关键组件。它将传统的卷积分解为深度卷积和1x1卷积,显著减少了计算量和模型复杂度,从而实现了模型的小型化而不牺牲太多性能。实验数据显示,YOLO-v5s-CBD在保持高性能的同时,模型大小仅为8.9MB,这大大有利于在资源有限的设备上部署。 此外,模型的性能评估也反映了其有效性。在VOC数据集上,YOLO-v5s-CBD的平均精度均值(mAP)达到了95.7%,F1分数为94.0%,精确率P为95.1%,召回率R为92.9%,这些指标均表明模型在植物识别任务上的出色表现。这些结果证实了所提出的改进模型对于植物识别任务的优越性,为未来类似的识别系统提供了有价值的参考和实践基础。
2024-09-06 上传