没有合适的资源?快使用搜索试试~ 我知道了~
工程科学与技术,国际期刊39(2023)101335一种用于田间害虫管理的昆虫图像分类的有效移动模型郑腾飞a,b,c,杨新亭a,b,c,吕家伟b,c,e,李明b,c,王善宁d,李文勇b,c,李伟a上海海洋大学信息学院,上海201306b农业信息化国家工程研究中心,北京100097c农产品质量可追溯国家工程实验室,北京100097d北京市农林科学院植物保护研究所,北方果树病虫害环境友好管理北京市重点实验室,北京100097e仲恺农业工程学院信息科学与技术学院,广州510225阿提奇莱因福奥文章历史记录:收到2022年2022年12月21日修订接受日期2023年1月3日可在线使用xxxx保留字:昆虫识别轻量级模型注意机制特征融合数据增强A B S T R A C T准确识别幼虫期害虫,对于及早对受害作物采取防治措施,及时减少农产品产量损失具有重要意义。基于卷积神经网络(CNN)的分类方法已经成为解决该领域中与图像识别相关的许多技术挑战的最具竞争力的方法。针对移动设备上携带的精确、小模型,提出了一种基于轻量级CNN嵌入注意机制的害虫分类方法PCNet(PestClassificationNetwork)PCNet以EfficientNet V2为骨干,采用协同注意机制(CA)学习输入图像的通道间害虫信息和害虫位置信息。此外,将移动反向瓶颈算法(MBConv)输出的特征图与平均池化算法输出的特征图相结合,开发了特征融合模块,实现了浅层与深层的特征融合,解决了下采样过程中害虫特征的丢失问题。此外,还采用了一种基于流水线的随机数据增强方法,以随机增强数据多样性,从而避免模型过拟合。实验结果表明,PCNet模型在由30类幼虫组成的自建数据集上实现了98.4%的识别准确率,优于三种经典CNN模型(AlexNet,VGG16和ResNet101)和四种轻量级CNN模型(ShuffleNet V2,MobileNet V3,EfficientNetV1和V2)。为了进一步验证在不同数据集上的鲁棒性,还在另外两个公共数据集上测试了该模型:IP102和miniImageNet。PCNet在IP102数据集上的识别准确率为73.7%,优于其他模型,在miniImageNet数据集上的识别准确率为94.0%,仅低于ResNet101和MobileNet V3。PCNet参数的数量为20.7 M,这比超经典的CNN模型少该模型具有良好的识别精度和较小的体积,适用于资源受限的移动设备环境下的实时害虫识别。我们的代码将在https://github.com/pby521/PCNet/tree/master上提供。©2023 Karabuk University. Elsevier B.V.的出版服务。这是CCBY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍现代农业需要在增加作物产量以满足不断增长的人口需求和限制农药使用以减少杀虫剂抗性和其他负面影响(如对非靶标生物的损害、环境污染和人类健康)之间保持微妙的平衡。此外,人民-*通讯作者:国家农业信息化工程技术研究中心,北京100097。电子邮件地址:liwy@nercita.org.cn(W. Li)。由Karabuk大学负责进行同行审查与人类生活密切相关的陆生昆虫的数量在过去20年中在某些地区下降了75%以上[12]。这是直接由于使用杀虫剂等因素造成的。因此,减少农药的使用,特别是尽可能减少对非靶标昆虫的危害,对现代农业的可持续发展至关重要实现这一目标的关键是准确及时地识别田间害虫幼虫期,从而进行精确的农药喷洒。传统的昆虫识别依赖于昆虫专家或技术人员的视觉检查,这是主观的,耗时的,并且阻碍了昆虫识别的大规模实施。https://doi.org/10.1016/j.jestch.2023.1013352215-0986/©2023 Karabuk University.出版社:Elsevier B.V.这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表工程科学与技术国际期刊杂志主页:www.elsevier.com/locate/jestchT. Zheng,X.Yang,J.Lv等人工程科学与技术,国际期刊39(2023)1013352×××技术[7] 15 21。随着配备摄像头的嵌入式设备变得越来越普遍,计算机视觉提供了一种有效的自动昆虫识别方法,可以显著提高害虫管理效率[18]。最近,深度学习(DL)技术的出现,特别是卷积神经网络(CNN)[13,14],为这一挑战带来了创造性的方法。许多研究人员已经使用DL技术设计了自动昆虫识别模型[11,16,25,29]。Wang等人[26]研究了AlexNet模型和迁移学习技术,以识别主要影响茶树的十种害虫,并达到了百分之九十三点八四。Li等人[16]提出了一种改进的GoogLeNet模型来处理农村场景的复杂背景,与最先进的方法相比增加了6.22%。Alves等人[1]设计了一个基于ResNet 34的深度残差学习网络,用于从基于田间的图像中自动分类主要棉花害虫,并实现了F-score为0.98的准确性Khan- Ramaki等人[11]提出了一种集成方法来分类柑橘害虫,并在1774张图像的柑橘数据集上实现了99. 04%的准确率。虽然在文献中已经取得了许多重大进展,但是这些基于DL模型的上述方法通常具有较大的模型尺寸和较高的计算成本,这使得它们不能直接在资源有限的边缘计算设备上运行。目前,种植者强烈需要使用移动设备识别田间害虫,特别是在幼虫阶段进行早期监测。与此同时,轻量级网络在图像分类任务中的应用可 以 帮 助 解 决 上 述 挑 战 。 Tang et al.[23] 选 择 ShuffleNet[33] 和channelwise attention机制提出了一种轻量级卷积神经网络来诊断葡萄疾病,分类准确率为99.14%,模型大小为4.2 M。Bao,Yang,Liang,Hu,and Yang[4]报道了一种利用倒置残差块的轻量级模型来自 动 识 别 小 麦 穗 部 病 害 , 分 类 准 确 率 达 到 94.1% , 参 数 为 2.13M.Suharjito等人。[20]创建了一个移动应用程序,使用轻量级CNN模型和数据增强方法对油棕鲜果串进行分类。Atila等人[2]提出了一种基于EfficientNet v1的深度学习架构来分类植物叶病,并实现了99.97%的准确率,优于其他最先进的深度学习模型。此外,Tan和Le[22] 提出了一种新的卷积网络EfficientNet v2,与以前的模型相比,它提供了更快的训练速度和更好的参数效率上述研究为设计移动网络同时保持其高识别精度提供了非常有价值的指导。因此,本研究的重点是创建一个有效的模型,以分类昆虫在其幼虫阶段使用的图像收集在外地,这是可用的边缘计算设备与低计算资源,特别是智能手机。 受EfficientNet v2架构优势的启发,提出了一种精确、轻量级的害虫幼虫识别模型。该研究的贡献摘要(1) 提出了一种用于田间害虫幼虫识别的高效移动模型PCNet。(2) 在模型中引入坐标注意(CA)模块,同时学习输入图像的通道间害虫信息和害虫位置信息,从而增强目标特征,抑制无用特征。(3) 嵌入一个特征融合组件,结合浅层和深层特征信息,以减少下采样过程中害虫特征的消失(4) 采用基于流水线的随机数据增强方法,随机增强数据多样性,从而避免模型过拟合。(5) 最终模型在30类害虫幼虫数据集上达到了98.4%的识别准确率,在IP102数据集上使用相对较少的参数。2. 材料和方法2.1. 数据集构建在这项研究中,数据集是由30种昆虫在其幼虫阶段的实地图像建立的。该数据集的图像是使用NIKON D200相机在中国北京郊区的不同地点拍摄的。图1显示了自建数据集中30种害虫的样本图像。害虫多为鳞翅目昆虫,成虫飞行能力强。特别是,大多数害虫在幼虫期的外观特征是相似的,而且它们与图像的背景也非常相似,这对图像识别任务提出了很大的挑战。由于各种因素,包括经济和物理限制,所收集的害虫图像的数量是有限的。因此,在图像采集后,使用数据增强技术从原始图像中生成更多图像,以防止模型过度拟合,这是基于深度学习的图像分类任务 中 常 用 的 方 法 [16 , 32] 。 在 本 研 究 过 程 中 , 采 用 了 称 为Augmentor[5]的数据增强方法来增加数据多样性,这是一种基于随机和该数据增强方法中的每个操作(诸如旋转、失真和缩放)允许用户定义概率以控制其被应用于当前输入图像的可能性,当单个图像通过基于流水线的方法时,其可以输出新的随机图像与基于增强策略学习的最近方法不同,这种方法避免了生成数据或学习增强参数所需的任何冗长的学习阶段本研究中的原始图像通过在Augmentor中应用一组操作来增强,以生成额外的图像,包括90度旋转、随机旋转(最大向左25度,向右10度)、水平翻转、上下翻转。图2中列出了一些样品。此外,所有图像的大小都调整为400267像素,JPG格式3颜色(RGB)通道。原始图像总数为2862张,数据增强后为5012张。如表1所示,首先将数据集以8:2的比例分成训练集和测试集,然后增加训练集的数量。2.2. 方法为了缓解高性能硬件资源的过度使用,在EfficientNet v2的基础上,利用迁移学习的过程,提出了一种改进的轻量级网络PCNet。特别地,设计了注意机制和特征融合模块,实现了低复杂度、高准确度的如图3所示,该模型架构主要包括卷积块、融合移动反向瓶颈卷积块、移动反向瓶颈卷积块、平均池化层和分类器块。PCNet的第一个卷积块中的这个3 3卷积层用于提取要表示的图像的各种特征为了增强模型的线性表示,用较少的参数提高CNN的深度,在其后面连接了10个融合移动反向瓶颈卷积块和30个移动反向瓶颈卷积块,然后有一个11卷积层将特征提取层的为了T. Zheng,X.Yang,J.Lv等人工程科学与技术,国际期刊39(2023)1013353图1.一、建议数据集中的昆虫害虫幼虫样本图像图二.数据扩充的示例图像。为了减小特征图的维数,同时扩展模型的感受域,利用自适应平均池化层。此外,输出特征图的大小可以不需要人为地设计参数,包括核大小,填充和步幅。最后一个分类器模块采用全连通层实现害虫分类。在PCNet模型中,通过迁移学习初始化通用网络层的权值,加快了模型的收敛速度同时,将Mobile反向瓶颈卷积模块中的SE注意力机制替换为协调注意力(CA)机制[9],同时在特征提取层的最后一个模块之后添加CA注意力模块,以增强卷积神经网络的全局注意力此外,通过在维度上对下采样的由卷积块生成的特征图和来自平均池化层的特征,来自浅层的特征与深层融合。2.3. 有效V2模型EfficientNet v2是Google Brain提出的EfficientNet的升级模型,它是一种基于训练感知神经架构搜索和扩展的新型移动规模卷积网络,在训练速度,准确性和参数效率方面优于其他以前的模型。广泛使用的深度卷积[6]是EfficientNet的另一个训练瓶颈。虽然深度卷积的参数和浮点数肯定比传统卷积少,但它们T. Zheng,X.Yang,J.Lv等人工程科学与技术,国际期刊39(2023)1013354×××2×2××表1自建数据集的详细描述指数名称原始训练图像增加后的培训批原创性测试图像指数名称原始训练图像增加后的培训原始测试图像1毛蕨761441816甘蓝夜蛾144144362柳珊瑚1441443617肾翼鸟属7214418和费尔德梨食菌属Matsumura3柑橘叶枯病菌481441118双翅凤蝶241446和罗斯勒斯塔姆4旋毛虫24144619黄凤蝶371449Linnaeus5春尺蠖28144720霍氏拟海鲶8714421埃尔肖夫基里亚科夫6n.月盘菌741441821联合拟夜蛾11314428沃克7核桃楸32144822大掌舟蛾144144368宽唇唇1241443023叶鞘藻属13614434不相似的9塔氏丽鱼761441924Pieris rapae601441410白杨小卷蛾691441725似赤藓351448Linnaeus11豆天蛾22144526萨米亚·辛西娅14014434青岛山12草履蚧20144427圆斑球壳菌861442113鞘突杜父鱼441441128中华刺蛾5314413摩尔14棉铃虫1441443629细鳞尾蝇961442415草地弯虾531441330印度凡妮莎9314423通常不能充分利用现代加速器。Effi-cientNet V2证明,深度卷积在早期层中很慢,但在后期阶段很有效率[22]。因此,标准3 × 3卷积代替MBConv中的dependent3 × 3卷积和扩展1 × 1卷积,从而产生融合MBConv 。 在 EfficientNet 的 基 础 上 , 结 合 Fusion-MBConv 和MBConv,以核大小和扩展比等超参数作为设计空间,采用训练感知神经结构搜索技术,得到EfficientNet V2的最终结构。2.4. 注意机制挤压和激励(SE)网络[10]用于捕获通道信息,以增强许多移动设计中的特征表示。虽然SE注意模块已被很好地用于各种图像分类任务,它只考虑重新加权不同的通道,但忽略了位置信息。在本研究中,引入了一种新的CA模块[9]来捕获通道关系和位置信息,以实现更好的特征表示。此外,本研究中使用的CA注意模块是一种有效的注意模块,在不增加大量计算开销的情况下,可以方便灵活地嵌入到经典分类网络中,从而提高卷积神经网络的特征表达能力。方向,但也保留沿其他空间方向的准确位置信息(见图。 5)。如图4b,CA模块可以使用两个步骤来计算:坐标信息嵌入和坐标注意生成。令输入特征图F hRC×H×W,其中R表示发送实数集,C表示信道数,H表示特征图的高度,W表示特征图的宽度。CA模块首先将二维全局池化操作分解为一对一维全局池化特征编码操作。然后,两个方向上的特征信息是两个方向上的特征信息的空间维度拼接,并且11卷积变换函数用于积分特征。然后将两个方向上的特征信息的空间维度缝合在一起,并使用1× 1卷积变换函数对特征信息进行积分,以获得F0h RC=r×1×WH,这是空间位置数据的说明在水平和垂直方向上编码CA模块首先将二维全局池化操作分解为一对一维全局池化特征因子,用于减少通道数量随后,空间维度F0被分解成两个不同的特征图,并使用两个1 - 1卷积来修改通过两个11卷积变换函数,然后通过Sigmoid激活函数获得最终特征最后,输入功能图F在两个方向上与特征图Gh和Gw相乘,以获得CA模的增强特征表示。两个模块之间的原理图比较可以在Fig.中找到 四、 如图 为了实现全局信息的嵌入,首先对全局信息进行压缩乌勒。输出YF这个EQ。(一).操作的2hRC×H×W在SE模块中通过全局平均池化将每个二维特征通道压缩成单个实数。然而,CA模块将信道注意力分别分离成垂直和水平特征编码过程(图4b)。因此,它生成了两个包含方向信息的注意力图,不仅可以捕获沿一个空间方向YF¼F×Gh×Gw2.5. 特征融合在这项研究中,提出了一个模块,融合的2× 2平均池层与下采样的输出特征图T. Zheng,X.Yang,J.Lv等人工程科学与技术,国际期刊39(2023)1013355××ð Þ ð Þ图三. 轻量级害虫识别模型框架。由融合移动卷积反向瓶颈块生成的特征图特征融合模块可以充分利用特征信息,减少下采样操作造成的特征丢失。浅层特征和深层特征的信息融合削弱了害虫图像特征图中信息的相似性,增强了害虫特征与背景的差异性,使目标害虫更加突出。图6提供了特征融合模块的构造的图示。如图所示。 6、输入特征图X h×w×c的大小为h w c。在融合移动反向瓶颈卷积块中,线性和非线性变换产生F(X),它具有网络的深层特征表达。F(X)可以表示为Eq. (二):FXTlfTnl½TlX]g2其中Tnl代表非线性变换,T1指示线性变换。A*X*是线性变换后的特征图,平均池化层的信息。它没有冗余信息和一个大的感知场。它可以简洁地表示为AX T lX 3在添加FX和AX之后,输出的特征图为Zh=2×w=2×c,它集成了深特征和浅特征。它可以用Eq来描述。(4).Z¼add½TlfTnl½TlX]g;TlX]42.6. 实验装置在我们的实验中,PCNet在三个不同的数据集上进行了评估首先,在自建数据集上进行消融实验,以评估本工作中提出的增强对模型的贡献。其次,在自建的害虫数据集中,T. Zheng,X.Yang,J.Lv等人工程科学与技术,国际期刊39(2023)1013356见图4。 CA块(b)与SE信道注意块(a)的架构比较。通过对几种CNN模型的仿真实验,比较了PCNet与其他CNN模型的性能差异。此外,为了证明模型的鲁棒性,这项工作比较了PCNet和其他CNN模型在公共数据集IP102和miniImageNet上的性能最后,比较了不同的注意机制对模型性能的影响。本研究的实验平台使用Intel® Core(TM)i9- 9900 K处理器(3.60GHz)和Windows 10操作系统。使用NVIDIA GeForce RTX 2080 Ti-11 GB(CUDA 11.4)加速GPU模型训练和测试。软件运行环境为Python 3.8.0和Pytorch 1.8.1框架。在训练PCNet模型时,采用Adam随机梯度下降法对有损失的网络模型进行T. Zheng,X.Yang,J.Lv等人工程科学与技术,国际期刊39(2023)1013357¼ð Þ图五. 使用CA构造移动反向瓶颈卷积块。见图6。 PCNet中的特征融合模块交叉熵函数Adam的方法由于其稳定性而适用于绝大多数非凸优化问题在修改训练参数和低内存需求。在模型训练过程中,数据集被统一处理,包括图像的随机水平翻转和随机中心裁剪,学习率设置为0.0001。训练周期的数量为epochs = 100,每批输入图像的batch_size = 32。权重初始化方法来自He et al.[8]在所有模型中使用3. 结果和讨论3.1. 评价指标本研究使用准确度、参数和浮点运算来衡量害虫识别模型的有效性。基于深度学习的模型有数百万个参数,在本研究中称为参数。浮点运算的数量以十亿为单位,用于衡量模型识别精度是对图像分类模型最关键的评价,其公式如下:精确性TP-5公司简介其中TP、TN、FP和FN的值定义如下:TP(真阳性)表示其标记被鉴定为阳性样品(正确鉴定)的阳性样品的数量,FP(假阳性)表示其标记被鉴定为阳性样品(错误鉴定)的阳性样品的数量,TN(真阴性)表示其标记被鉴定为阴性样品(正确鉴定)的阴性样品的数量,FN(假阴性)表示其标记被鉴定为阴性样品(错误鉴定)的阴性样品的数量。3.2. 消融研究为了验证该模型中不同部件的性能,本研究进行了烧蚀实验。数据增强、CA模块和特征融合是烧蚀实验的不同组成部分。表2列出了结果表2消融实验的结果。模型因素准确度(%)参数(M)FLOPs(G)数据增强SE?CA+CA特征融合EfficientNet v2––––94.920.2152.84U–––96.420.2152.84–U––97.420.6002.88––U–96.420.2232.84–––U96.220.2152.84PCNetUUUU98.420.7002.88T. Zheng,X.Yang,J.Lv等人工程科学与技术,国际期刊39(2023)1013358其中,模型模型的参数由Params表示,而FLOPs显示每秒可以执行多少次可以发现,v2模型在自建数据集上取得了94.9%的高准确率。加入数据增强后,精度提高了1.5%。'' SE?表2中的“CA见图7。 来自不同卷积层的输出特征图的结果。T. Zheng,X.Yang,J.Lv等人工程科学与技术,国际期刊39(2023)1013359×见图8。消融实验的训练曲线使用所提出的数据集。(准确性和损失)。2.5%。 特征融合模块将模型的识别准确率提高特别地,在图7中示出了包括和不包括特征融合模块的卷积层特征映射结果如图所示。7、PCNet模型提取图像的特征信息,如纹理、边缘等,在较浅的卷积层,如Conv 2d-6和Conv 2d-9。 随着卷积层的深入,例如从图中的Conv 2d-11,Conv 2d-20到Conv 2d-30。 7、特征图中包含的视觉信息逐渐减少,抽象信息增加。通过比较图中的第六层,在图7(b)和(c)中,随着特征融合模块的引入,目标的轮廓信息变得更加丰富。此外,可以看出,第11卷积层的特征逐渐变得抽象,并且在图7(c)中示出了更多的位置信息。同时,由于融合了浅层特征图中的定位信息和深层特征图中的语义信息,通过比较图7(b)和图7(c)中的第30层,感兴趣区域的特征更加明显。最后,通过引入上述所有改进点,PCNet的准确率达到98. 4%,比基线模型提高了3. 5%。PCNet实现了更高的识别准确性,同时确保低复杂性,仅略微增加0.5 M. 图8描绘了在自构建数据集上的消融实验的训练曲线,其中A表示模型测试精度,E表示训练周期,L表示训练损失。从训练曲线中可以发现,PCNet很快达到收敛趋势,并最终在准确率和损失图中稳定下来,并且基于EfficientNet v2的改进点都为训练过程带来了有利的好处3.3. 不同数据集为了评估PCNet模型的性能,除了四个轻量级模型(ShuffleNet,MobileNet V3,EfficientNet-B5和EfficientNet V2-S)之外,还考虑了三个经典CNN模型(AlexNet,VGG 16和ResNet 101),用于在自建 数 据 集 和 两 个 公 共 数 据 集 上 进 行 比 较 : IP 102[31] 和 miniI-mageNet[13]。IP102数据集包括102个物种的75,000多张图像,符合真实环境中昆虫害虫分布的几个特征(例如,多样性和阶级不平等,ance),这是更适合于验证本研究中所提出的模型的害虫分类性能。miniImageNet数据集包含100个类别的60,000张彩色图像,每个类别包含600个样本,每个图像的分辨率为8484像素。它是复杂的,适合于原型设计和实验研究。表3显示了对所提出的数据集的识别结果。如表3所示,PCNet模型实现了最高的准确性,分别比Efficient v2、VGG 16和MobileNet V3高3.5%、4.1%和2.7%,而计算成本仅略有增加,模型的参数量仅为大规模网络VGG 16的1/7左右。 虽然ShuffleNet v2和MobileNet v3的参数和FLOP低于PCNet,但PCNet的准确率为98.4%,分别比ShuffleNetv2和MobileNet v3高出17.6%和2.7%。在实际应用中,在保证模型复杂度较低的前提下,准确度对于田间害虫识别和精确控制更为关键和重要。为了在其他识别任务中进一步测试PCNet模型,所有模型都在大规模公共数据集IP 102和miniImageNet上进行了训练。表4显示了所有模型在公共IP 102数据集上的结果。可以看出,PCNet达到了73.7%,优于基准网络EfficientNet v2以及其他模型。这表明PCNet也具有竞争力的识别性能用于具有相对低的图像质量的大规模和类别不平衡的害虫分类任务。表5显示了miniImageNet上不同模型的准确性结果。PCNet模型的准确率为94.0%,高于AlexNet和VGG16等同时发现,表3使用建议的数据集比较每个模型模型准确度(%)参数(M)FLOPs(G)AlexNet89.058.4001.10VGG1694.3134.3815.11ResNet10192.042.5607.64ShuffleNet V280.81.2800.15MobileNet V3-大型95.74.2400.21EfficientNet-B592.328.4022.42EfficientNet V2-S94.920.2152.84PCNet98.420.7002.88T. Zheng,X.Yang,J.Lv等人工程科学与技术,国际期刊39(2023)10133510表4使用公共数据集(IP102)分析每个模型模型准确度(%)参数(M)FLOPs(G)AlexNet59.058.701.10VGG1670.1134.6815.11ResNet10163.042.710.76ShuffleNet V250.71.400.15MobileNet V3-大型69.14.300.23EfficientNet-B567.228.502.42EfficientNet V2-S70.020.312.80PCNet73.720.702.88表5使用公共数据集(miniImageNet)分析每个模型与使用SE模块的模型相比,参数和FLOP的数量略有增加。同时,为了说明不同注意模块的注意区域,使用Grad CAM算法实现了SE、CBAM、ECA和CA模块的特征图的可视化输出(图9)。图9(a-c)是本研究中三种害虫的原始图像。很明显,SE和ECA关注模块集中在害虫的某些区域,而CBAM模块结合了更多不属于目标的区域。相比之下,CA模块更多地关注完整的害虫区域而忽略背景区域。结果表明,集成CA注意模块允许模型专注于图像中的目标害虫区域,减少背景对识别的影响。模型准确度(%)参数(M)FLOPs(G)3.5.与以往研究的AlexNet61.358.701.10VGG1684.5134.6715.11以前的几项研究已经进行了类似的ResNet101ShuffleNet V296.186.042.711.407.640.15然而,他们中的大多数人只是通过改进各种CNN结合Dif.MobileNet V3-大型EfficientNet-B595.390.44.2428.500.212.42数据预处理技术,而不考虑EfficientNet V2-S93.820.302.84与轻量级模型相关的问题与前相比PCNet94.020.702.88Thenmozhi和Srinivasulu Reddy的研究[24],作者提出了一种基于AlexNet架构的PCNet的结果低于resnet101和MobileNet V3网络。原因是Resnet101的网络结构很复杂,并且大量参数都是在大规模ImageNet数据集上训练的。PCNet模型在两个害虫数据集上的性能都优于MobileNet V3网络,而在miniImageNet数据集上获得了相反的结果。原因可能与数据集有关。自建数据集和IP102数据集的大多数对象都是小型昆虫,而miniImageNet的对象主要是鸟类,狗,鲸鱼,家具等较大的目标。因此,可以证明PCNet在本研究中对昆虫等小目标的定位和特征提取更有效。3.4. 不同注意方法将所提出的模型PCNet中使用的CA注意力模块与其他经典注意力机制进行比较,例如挤压和激励模块(SE)[10],卷积块注意力模块(CBAM)[30]和高效信道注意力(ECA)模块[28]。CBAM模块是通道注意力和空间注意力的串联组合,其提取的特征比仅关注通道信息的SE注意力模块覆盖了待识别对象的更多部分。ECA模块去除了SE模块中的全连接层,并对全局平均池化特征进行一维卷积运算,有效避免了降维对通道注意力的负面影响。 表6显示了在自建数据集上使用上述四个注意力模块的识别准确率结果,可以看出,使用CA mod的PCNet识别准确率最高。见图9。对使用SE模块、CBAM模块、ECA模块和CA模块进行了直观的比较。表6使用建议的数据集比较建议的模型的不同注意力方法。表7与IP102数据集上先前文献的准确性比较工作准确率(%)模型准确度(%)参数(M)FLOPs(G)[三十一][19个]49.5055.24+SE96.220.252.84[17个]61.93+CBAM96.127.362.86[3]第一章67.13+非洲经委会95.916.512.84[32个]73.29+CA(PCNet)98.420.702.88我们的研究73.7T. Zheng,X.Yang,J.Lv等人工程科学与技术,国际期刊39(2023)10133511并使用数据增强,如翻转,旋转和缩放,以防止模型过拟合。尽管类似的数据增强技术也用于一些先前的文献[16,27]和我们的研究中,但在他们的研究中,昆虫图像在训练之前被手动裁剪。Alves等人[1]提出了一种深度残差模型,仅用于处理关于棉花害虫的分类任务。以前的一些研究提出了集成方法来评估不同数据集的识别性能,包括IP 102数据集[3,17]。此外,引入显著性方法和注意力机制来突出最相关的像素[17,32]。与上述研究相比,我们的研究旨在提出一种轻量级模型,该模型可以部署在边缘计算设备上,以识别幼虫阶段的昆虫害虫,以便在现场进行早期监测。此外,我们的研究不仅在自建数据集上进行了评估,还在两个大规模的公共数据集上进行了评估图10个。不同手机的模型部署比较(华为(a)和红米(b))。T. Zheng,X.Yang,J.Lv等人工程科学与技术,国际期刊39(2023)10133512一个是害虫数据集(IP102),另一个是计算机视觉社区的自然数据集(miniImageNet)。表7中列出了与IP102数据集上其他先前最先进模型的定量和公平比较。实验结果表明,该方法在IP102数据集上的准确率达到了73.7%,达到了目前的水平。此外,我们的代码是公开的,以促进社区在这一领域的研究。3.6.模型部署和分类测试我们将训练好的模型部署在典型的智能手机上,并使用两个型号-Redmi K50(Android版本为12.0)和华为P40 Pro(Android版本为10.1.0,处理器为华为麒麟990 5G,运行内存为8 GB)-以表明PCNet模型在移动设备上是操作内存为8 GB,处理器为天贵8100。Android作为开发软件平台(Studio Patch 1,Java编程语言)。我们将训练权重文件更改为图10显示了在各种类型的设备上的识别结果和时间,并且很明显,该模型在实时性和移动设备上的识别方面都表现良好。4. 结论基于图像的害虫识别,特别是幼虫期的识别,是害虫早期监测和提高作物产量的重要手段之一。深度学习技术,特别是CNN,可以显著提高使用田间图像的害虫分类准确性。为此,本研究提出了一种新的轻量级和高效的害虫分类模型称为PCNet。PCNet是基于EfficientNet v2的增强模型,该模型引入了新颖的注意机制CA模块,增强了对复杂相似背景下害虫特征的表示,更加关注害虫信息。此外,PCNet使用特征融合模块来减少在不同深度层的下采样过程中害虫特征的损失。在自建数据集和公开的IP102数据集上的实验结果表明,该结构具有较好的有效性和鲁棒性,在多种害虫识别中的性能优于其他经典CNN和轻量级模型。在未来的工作中,我们将在移动设备上部署所提出的模型,用于早期害虫监测,并将其移植到其他类似领域。竞争利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作。确认作 者 感 谢 国 家 重 大 技 术 研 发 计 划 ( 2022YFD2001801 ,2022YFD2001804)、北京市农林科学院推进与创新项目、北京市青年学者计划的支持。引用[1] A.N.阿尔维斯,W.S.R. Souza,D.L. Borges,使用深度残差网络进行基于实地图像的棉花害虫分类,Comput。电子农业174(2020),https://doi.org/10.1016/j.compag.2020.105488105488。[2] - 是的Atila,M.乌萨尔湾Akyol,E. Uçarb,使用EfficientNet深度学习模型进行植物叶病分类,Eco。告知。61(2021),https://doi.org/10.1016/j.ecoinf.2020.101182101182。[3] E. Ayan,H.Erbay,F. Varçán,基于遗传算法的深度卷积神经网络加权集成的作物害虫分类,Comput。电子农检179(2020)105809.[4] W.鲍,X. Yang,杨氏D. Liang,G. Hu,X.杨,基于轻量级卷积神经网络的小麦穗 部 病 害 识 别 模 型 , 计 算 机 。 电 子 农 业 189 ( 2021 ) ,https://doi.org/10.1016/j.compag.2021.106367106367。[5] 布洛伊斯湾D、罗斯,P.M.,Holzinger,A. 2019.使用Augmentor的生物医学图像增强。Bioinformatics,35(21),4522-4524.https://doi.org.cn/10.1093/bioinformatics/btz259.[6] Chollet , F.2017.Xception : Deeplearningwithdependentlyseparableconvolutions,发表于2017年IEEE计算机视觉与模式识别会议(CVPR)。[7] W.丁氏G.泰勒,自动蛾检测从陷阱图像害虫管理,计算机。Electron. Agric. 123(2016)17https://doi.org/[8] 他,K.,张,X.,Ren,S.,Sun,J. 2015. 深入研究整流器:在ImageNet分类上超越人类水平的性能,在IEEE国际计算机视觉会议上发表的论文。[9] Hou,Q.,Zhou,D.,中国科学院学报,Feng,J.J.A. E.- P. 2021.协调注意力以实现高效 的 移 动 网 络 设 计 。 arXiv : 2103.02907 。 检 索 自 https://ui.adsabs 。harvard.edu/abs/2021arXiv210302907H网站。[10] J. Hu,L. Shen,S. Albanie,G.孙,E.吴,挤压和激励网络,IEEE trans.PatternAnal。马赫内特尔42(8)(2019)2011https://doi.org/[11] M. Khanramaki,E. Askari Asli-Ardeh,E. Kozegar,使用深度学习模型集成的柑橘害虫分类,Comput。186(2021),https://doi.org/10.1016/j.compag.2021.106192106192.[12] C. Kirkeby,K. Rydhmer,S.M. Cook,A. M. T. J.L.托兰斯Swain,J. Prangsma,A.Johnen,M.詹森,M。Brydegaard,K. Grsbøll,使用光学传感器和机器学习,科学。众议员11(1)(2021),https://doi.org/10.1038/s41598-021-81005-0。[13] Krizhevsky,A.,萨茨克弗岛,巴西-地Hinton,G.E. 2012年。使用深度卷积神经 网 络 进 行 ImageNet 分 类 国 际 会 议 神 经 信 息 流 程 。 系 统 : 25 ( 2 ) .10.1145/3065386.[14] Y. 莱 昆 湾 , 巴 西 - 地 本 焦 湾 Hinton , Deep learning , Nature 521 ( 7553 )(2015)436https://doi.org/10.1038/nature14539[15] W. Li,D.Wang,M.Li,Y.高,J. Wu,X. 杨,在农业温室中使用深度学习从粘性 陷 阱 图 像 中 检 测 微 小 害 虫 电 子 农 业 183 (
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于Python和Opencv的车牌识别系统实现
- 我的代码小部件库:统计、MySQL操作与树结构功能
- React初学者入门指南:快速构建并部署你的第一个应用
- Oddish:夜潜CSGO皮肤,智能爬虫技术解析
- 利用REST HaProxy实现haproxy.cfg配置的HTTP接口化
- LeetCode用例构造实践:CMake和GoogleTest的应用
- 快速搭建vulhub靶场:简化docker-compose与vulhub-master下载
- 天秤座术语表:glossariolibras项目安装与使用指南
- 从Vercel到Firebase的全栈Amazon克隆项目指南
- ANU PK大楼Studio 1的3D声效和Ambisonic技术体验
- C#实现的鼠标事件功能演示
- 掌握DP-10:LeetCode超级掉蛋与爆破气球
- C与SDL开发的游戏如何编译至WebAssembly平台
- CastorDOC开源应用程序:文档管理功能与Alfresco集成
- LeetCode用例构造与计算机科学基础:数据结构与设计模式
- 通过travis-nightly-builder实现自动化API与Rake任务构建
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功