DLNet模型提升果园遮挡果实识别与分割的性能

PDF格式 | 1.72MB | 更新于2025-01-16 | 154 浏览量 | 1 下载量 举报
收藏
DLNet模型是一项针对自然果园中被遮挡果实的精确识别和分割的创新解决方案,它发表于沙特国王大学学报。该模型由山东师范大学信息科学与工程学院和卡迪夫大学工程学院的研究团队共同开发,旨在应对果园中复杂环境下的挑战,如遮挡、同色背景和损坏情况。 DLNet模型的核心在于结合了一种改进的目标检测网络RS-RFP和一个专门的分割网络。RS-RFP是基于全卷积一阶段目标检测(FCOS)的扩展,通过特征金字塔网络(FPN)和引入的高斯非局部注意机制构建出细化金字塔网络(RFP),这有助于提高对残留网络(ResNet)生成的语义特征的解析能力。这种方法提高了模型对目标检测的准确性。 而DLNet分割框架则是采用了双层图形注意力网络(GAT)设计,这种独特的结构将图像视为两个重叠层次,上层GAT负责检测被遮挡的对象,下层GAT则负责识别部分被遮挡的实例,同时捕捉遮挡关系并考虑对象间的交互。这种设计使得模型能够自然地描绘遮挡和遮挡实例之间的边界,并且更加灵活地处理遮挡问题。 实验结果显示,DLNet模型在果实识别和分割任务上的性能优越,平均精度(AP)框和AP掩模分别达到了80.9%和81.2%,证明了其在实际应用中的高效性和鲁棒性。这对于果园采摘机器人的自动化操作,如精准定位和采摘遮挡的果实,具有重要意义。此外,该研究还强调了深度学习技术在农业领域的潜力,特别是在作物识别和监控方面,如水果产量评估、生长监测和病害检测。 DLNet模型通过集成先进的目标检测和分割策略,为解决果园中遮挡果实的识别难题提供了一种创新且实用的方法,这对于推动农业机器人技术的发展以及提升农作物管理效率具有积极的推动作用。

相关推荐