YOLO v5s-CBD: 提升植物识别的轻量化模型
117 浏览量
更新于2024-08-03
1
收藏 1.44MB PDF 举报
"这篇论文由马宏兴等人撰写,发表在《农业机械学报》上,探讨了基于改进YOLO-v5s的轻量化植物识别模型。针对原YOLO-v5s模型在处理复杂背景下的植物识别问题,研究团队提出了YOLO-v5s-CBD模型。该模型引入了Transformer模块的BoTNet主干网络,结合卷积和自注意力机制,增强了模型对全局信息的捕捉能力。同时,模型还融合了坐标注意力机制,提升了对通道和位置信息的敏感性。为了优化模型结构并减小其体积,YOLO-v5s-CBD应用了深度可分离卷积。实验结果显示,该模型在Nvidia GTX A5000 GPU上的运行帧率为140帧/s,模型大小为8.9MB,取得了高精度、高召回率和高F1分数,显示了出色的植物识别性能。"
在当前的植物识别领域,快速准确地识别不同种类的植物对于环境监测、生态保护以及农业生产和研究至关重要。YOLO (You Only Look Once) 是一种实时目标检测系统,尤其适用于实时场景。YOLO-v5s 是YOLO系列的一个变体,以其高效和高精度而被广泛采用。然而,YOLO-v5s 在处理复杂背景时可能遇到挑战,其较大的参数量也可能影响到模型的部署和计算效率。
论文中提出的YOLO-v5s-CBD模型进行了多方面的改进,以适应复杂的植物识别任务。首先,引入Transformer模块的BoTNet作为特征提取网络的一部分,Transformer的自注意力机制能够处理长距离依赖,增强模型对全局信息的理解。其次,坐标注意力机制(Coordinate Attention, CA)的加入,使得模型能够更好地理解目标的位置信息,这对于植物识别这类需要精细定位的任务尤其重要。此外,使用SIoU函数改进了损失函数,解决了预测边界框与真实边界框的匹配问题,提高了定位的准确性。
深度可分离卷积(Depthwise Separable Convolution, DSC)是轻量化模型的关键组件。它将传统的卷积分解为深度卷积和1x1卷积,显著减少了计算量和模型复杂度,从而实现了模型的小型化而不牺牲太多性能。实验数据显示,YOLO-v5s-CBD在保持高性能的同时,模型大小仅为8.9MB,这大大有利于在资源有限的设备上部署。
此外,模型的性能评估也反映了其有效性。在VOC数据集上,YOLO-v5s-CBD的平均精度均值(mAP)达到了95.7%,F1分数为94.0%,精确率P为95.1%,召回率R为92.9%,这些指标均表明模型在植物识别任务上的出色表现。这些结果证实了所提出的改进模型对于植物识别任务的优越性,为未来类似的识别系统提供了有价值的参考和实践基础。
2024-04-11 上传
2021-10-01 上传
2024-10-21 上传
2021-03-30 上传
2024-04-15 上传
2021-04-16 上传
PeterClerk
- 粉丝: 614
- 资源: 69
最新资源
- Haskell编写的C-Minus编译器针对TM架构实现
- 水电模拟工具HydroElectric开发使用Matlab
- Vue与antd结合的后台管理系统分模块打包技术解析
- 微信小游戏开发新框架:SFramework_LayaAir
- AFO算法与GA/PSO在多式联运路径优化中的应用研究
- MapleLeaflet:Ruby中构建Leaflet.js地图的简易工具
- FontForge安装包下载指南
- 个人博客系统开发:设计、安全与管理功能解析
- SmartWiki-AmazeUI风格:自定义Markdown Wiki系统
- USB虚拟串口驱动助力刻字机高效运行
- 加拿大早期种子投资通用条款清单详解
- SSM与Layui结合的汽车租赁系统
- 探索混沌与精英引导结合的鲸鱼优化算法
- Scala教程详解:代码实例与实践操作指南
- Rails 4.0+ 资产管道集成 Handlebars.js 实例解析
- Python实现Spark计算矩阵向量的余弦相似度