咖啡叶生物胁迫分类的少样本学习及性能评估

194 浏览量更新于2023-12-06 收藏 1.97MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

农业中的人工智能6（2022）55咖啡叶生物胁迫分类的少样本学习卢卡斯·M雷纳托·塔布Krohlinga，b，aLABCIN-Nature Inspired Computing Lab，Federal University of EbertoSanto，Av. Fernando Ferrari，514，CEP，29075-910 Vitória，EspañritoSanto，ES，BrazilbPPGI-计算机科学研究生课程，埃内斯托圣托联邦大学，埃内斯托圣托大道。Fernando Ferrari，514，CEP 29075-910，Vitória，圣埃斯皮里图，巴西a r t i c l e i nf o文章历史记录：2021年8月17日收到2021年12月31日收到修订版，2022年2022年4月9日在线发布保留字：植物病虫害分类图像分类元学习卷积神经网络a b s t r a c t在过去的几年里，深度神经网络在多个领域取得了可喜的成果然而，这些方法的一个主要局限性是需要大规模的数据集进行适当的概括。小样本学习方法的出现是为了解决这个缺点。在少数学习方法中，有一类方法被称为嵌入学习或度量学习。这些方法通过学习比较来解决分类问题，需要较少的训练数据。植物病虫害识别中的主要问题之一是缺乏可用的大型公共数据集由于这种困难，该字段作为一个有趣的应用程序出现，由于农业在一些国家的社会和经济重要性，该领域也是相关的。在这项工作中，数据集组成的生物压力在咖啡叶作为一个案例研究，以评估性能的几杆学习分类和严重性估计任务。与文献报道的分类任务相比，我们取得了有竞争力的结果，准确率接近96%。此外，我们在严重程度估计任务中取得了更好的结果，比基线高出6.74%的准确度版权所有© 2022作者。出版社：Elsevier B.V.我代表科爱通信公司，公司这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍植物经常暴露于环境胁迫，这可能对生长和生产造成巨大影响植物胁迫可以是生物胁迫和非生物胁迫。生物胁迫是由病原体如真菌、细菌、病毒引起的它们也可能是由害虫引起的另一方面，非生物胁迫由热、干旱、寒冷、盐度等引起（Suzuki et al.， 2014年）。咖啡是巴西的主要作物之一，尤其是在圣埃斯皮里图州。农民面临的主要挑战之一是影响咖啡作物的病虫害它们可以限制小农户和大农户的产量，造成可能损害作物收成的损失。每一种压力都需要精确的管理，使用错误的技术可能会对环境和工人的健康造成损害。它们还可以降低最终产品的质量（Ventura等人， 2017年）的报告。在影响咖啡叶的生物胁迫中，四种主要的生物胁迫是潜叶虫、锈病、褐斑病和尾孢叶斑病。图 1说明了压力引起的症状。除了对影响叶片的压力进行分类外，估计其严重程度也很严重性由* 通讯作者： LABCIN-Nature Inspired Computing Lab ， Federal University ofEbertoSanto，Av. Fernando Ferrari，514，CEP，29075-910 Vitória，Espırito Santo，ES，Brazil.电子邮件地址：rkrohling@inf.ufes.br（R.A.Krohling）。受伤的叶子面积的百分比精确的严重性估计可以用于预测产量损失、监测和预测流行病以及正确的管理决策（Bock等人， 2010年）。由于以下几个因素，对植物生物胁迫进行分类并估计其严重程度是一项复杂的任务：缺乏对病变区域的精确界定;同一类型病变之间的特征变化（如颜色，形状和大小）;同一叶片上存在多个病变;以及不同胁迫可能具有相似症状的事实（Barbedo，2016）。在过去的几年中，深度学习技术已经在图像分类和识别方面呈现出有希望的结果（Goodfellow等人， 2016 年）。这些技术甚至已经成功地用于植物病害的分类（Boulent等人， 2019年），成为帮助农民和农业专业人员的有用工具。然而，传统的机器学习和深度学习技术存在一些局限性，其中之一是需要大规模数据集才能很好地推广模型（Wang et al.，2020年）。因此，提出了新的方法，旨在创建模型，推广以及更少的数据。这导致了元学习方法的提出（Hospedales等人，2020），特别是少数射击学习方法。有限的数据集数量是使用深度学习技术进行植物病虫害识别的主要挑战之一（Barbedo，2018）。这会导致弱模型，因为数据集没有足够的深度神经网络示例。https://doi.org/10.1016/j.aiia.2022.04.0012589-7217/© 2022作者。出版社：Elsevier B.V.我代表科爱通信公司，公司这是一篇CC BY-NC-ND许可证下的开放获取文章（http：creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表农业中的人工智能杂志主页：http://www.keaipublishing.com/en/journals/农业人工智能/L.M. Tendon和R.A.克罗林农业人工56图1.一、影响咖啡叶的生物胁迫的例子。网络要正确推广。因此，研究用于植物胁迫分类的少样本学习方法具有重要意义.如前所述，文献中有几项工作将深度神经网络应用于植物病害识别。他们中的大多数在不同的作物中利用传统的卷积神经网络，获得超过90% 的准确度值（ Mohanty等人，2016; Rahman等人， 2018;Elhassouny和Smarandache，2019; Geetharamani和Pandian，2019;Barbedo，2019）。一些研究还探索了深度神经网络在咖啡作物中的应用Manso等人（2019）开发了一种将传统分割算法与神经网络相结合的方法，用于对咖啡叶图像中的斑点进行分类。该算法还使用分割的斑点面积来估计病变的严重程度 Esgario等人（2020）使用深度学习来分类和估计cof-fee叶和症状图像中病变的严重程度。在他们的工作中，他们还评估了多任务网络在分类和严重性估计方面的使用这项工作使用了与这项工作中使用的相同的数据集，作为使用少数学习方法获得的结果的基线Esgario等人（2022）开发了一种类似的方法，但他们没有使用传统的分割方法，而是在分割任务中使用了深度神经网络。除该算法外，还开发了智能手机应用程序，以帮助农民识别疾病和害虫。Tyndal等人（2021）提出了一种结合实例和语义分割的方法来识别田间咖啡树图像中的病虫害。他们的方法包括一个三阶段的方法，结合实例分割，语义分割和分类来分类和估计影响咖啡树的病变的严重程度最近，一些工作开始探索在植物病害识别中使用少量Wang和Wang（2019）探索了将三种不同类型的叶子的疾病分类的si-mese网络架构他们获得了超过90%的准确率，而在训练集中每个类只使用20个Argüeso等人（2020）评估了在PlantVillage数据集中具有三重丢失的连体网络，其准确度值也达到90%以上。第一步是训练一个卷积神经网络（CNN）用于一般植物特征提取.接下来，他们评估了新的不可见类的微调，在减少近90%的数据集上训练时获得了类似的Jadon（2020）提出了SSM（Stacked Siamese Matching）网络，结合了两种少镜头学习方法：Siamese Networks和Matching Net- works。该方法在两个植物数据集上获得了超过92%的准确率，优于经典的CNN架构。接下来，A fifi et al. （2021 ）评估了Triplet Network 和深度对抗度量学习（DAML）在转移训练域时的性能。当域偏移很小时，他们达到了这项工作还表明，在大型数据集上训练的模型可以通过使用少量学习方法在小型数据集上进行微调在这项工作中，我们探索使用少镜头学习和特征提取植物胁迫识别和严重程度估计。为了进行实验，我们将使用咖啡叶中生物压力的数据集。本文的其余部分组织如下。第2节介绍了深度学习和少次学习的一些基本概念。此外，我们还描述了在这项工作中使用的三重网络和原型网络的方法。第3节介绍了实验装置和结果。最后，在第四节中，我们得出了一些结论。2. 方法2.1. 预赛在本节中，我们将介绍深度学习的一些基本概念，描述卷积神经网络。卷积神经网络（CNN）（LeCun等人，1989）被提出来处理具有网格状拓扑结构的数据，例如图像，并且在计算机视觉的实际应用中取得了成功（Goodfellow等人， 2016年）。标准CNN由三种主要类型的层组成：卷积层、池化层和全连接层。图图2示出了通用CNN架构的示例。2.1.1. 卷积层该网络在应用于该层的卷积的数学运算之后被命名为卷积（Goodfellow等人，2016年）。该层负责从输入数据中提取特征这些特征可以是边、点，甚至是完整对象。卷积层由一组可学习的滤波器组成，也称为内核。这些核在输入数据上滑动（即卷积），产生特征图作为输出（也称为激活图）（Li等人，2021年）。在卷积层的最后，我们通常会在生成的特征图中应用激活函数。激活函数很重要，因为它们将非线性引入输出，消除所有负值，并突出显示重要特性。文献中使用的常用激活函数是矩形线性单元，或简称为ReLU（Goodfellow等人， 2016年）。2.1.2. 池化层在池化层中，来自卷积层的特征图通过池化（也称为下采样）操作在空间上减少。池化操作从激活图中统计地总结区域，减小它们的大小，同时保持它们的主要特征（Goodfellow等人，2016年）。执行池化操作的两种常见方式是最大轮询和平均轮询。在最大池中另一方面，在平均池中，我们通过计算平均值来汇总值集L.M. Tendon和R.A.克罗林农业人工57图二、由卷积层、池化层和全连接层组成的卷积神经网络的插图。2.1.3. 全连接层全连接层由典型的前馈网络组成，也称为多层感知器（MLP）（Goodfellow例如，2016年）。它们通常充当CNN中的分类器，使用前一层提取的特征作为输入。在CNN的背景下，馈送到全连接网络的输入是来自卷积层和池化层的特征图。由于特征映射是张量，并且全连接网络接收向量作为输入，因此对映射应用一个matten运算符，返回一个向量。CNN架构也可以在没有完全连接层的情况下使用，返回经过处理的向量作为输出。这个向量有时被称为嵌入。这种产生嵌入的架构广泛用于少量学习环境中，如下一节所述。在下文中，我们将介绍一些关于少次学习的基本概念。首先，第2.2节介绍了少数学习中的一些基本概念和定义。接下来，第2.3节介绍了嵌入学习方法，描述了本工作中使用的方法2.2. 少数学习机器学习和深度学习的主要缺点之一是需要大规模数据来正确概括（Wang et al.， 2020年）。为了解决这个问题，提出了元学习范例（Hospedales等人，2020），特别是少数学习方法（Wang et al.，2020年）。少镜头学习（FSL）旨在使用有限的训练数据来解决任务这类算法的灵感来自于这样一个事实，即人类只需要少量的例子来学习和概括一些任务。例如，给定一个陌生人的几张照片，我们可以很容易在另一组图片上认出这个人（Wang等人，2020年）。大多数FSL方法提出的监督学习问题，如图像分类和对象识别。虽然在这项工作中没有探索，但少量学习的主要用途之一是学习泛化到训练期间看不到的新类（Wang et al.， 2020; Hospedales等人， 2020年; Chen等人， 2020年）。与大多数机器和深度学习传统算法不同，在少数镜头学习环境中（更具体地说，在少数镜头图像分类环境中），我们通常在从训练数据创建的一组任务一些作者也将其称为事件（Ravi和Larochelle ，2017）。每个任务都有一个支持集和一个查询集。查询集由我们想要进行一些推断的数据组成（即，我们希望在分类问题中分类的数据）。支持集由我们用来辅助推理的标记数据我们通常将一个任务描述为n路k次问题，其中n是支持集中的类数，k是支持集中每个类的样本数图图3示出了一个少量学习任务的示例。在文献中有几种方法对FSL方法进行其中之一是将方法组织为基于初始化的方法、基于距离度量学习的方法和基于幻觉的方法（Chen等人，2020年）。2.2.1. 基于网络的方法通过学习微调来解决少数学习问题。对此有两种主要方法其中之一试图学习良好的模型初始化（即，网络的参数），而其他焦点集中在学习优化器上。这两种方法都减少了对数据的需求或训练网络的梯度步骤的数量图3. 3-way 3-shot任务的示例。在这个例子中，n=3，因为我们在支持集中有三个不同的类（尾孢叶斑病、潜叶病和褐叶斑病）;k=3，因为我们在支持集中每个类有三个例子查询集包含我们要在支持集中的图像的辅助下进行分类的图像L.M. Tendon和R.A.克罗林农业人工582ðÞ2þ2.2.2. 基于距离度量学习的方法通过学习比较来解决少数学习问题。这些方法试图通过训练模型来学习图像之间的相似性，而不是训练模型来简单地对输入图像进行分类，从而减少对数据的需求。直觉上，如果一个模型可以区分两个不同的图像，它就可以学会用很少的数据对看不见的类进行这些方法也被称为嵌入式学习方法。2.2.3. 幻觉方法通过学习增强来解决少次学习问题。这些方法直接解决了数据的缺乏，试图使用可用的数据来学习生成器然后，该生成器可以为数据扩充创建在我们的工作中，我们专注于基于距离度量学习（也称为嵌入学习）的方法。选择这类方法是因为在图像分类任务中有希望的结果。在下一节中，我们将提供更多关于这类方法的见解和定义。2.3. 嵌入式学习嵌入式学习是一类通过学习比较来将分类任务转化为比较问题的少样本学习方法。但是模型是如何学会比较的呢？嵌入学习方法产生表示（即，嵌入）使用嵌入函数对具有比原始输入更低维度的输入数据进行处理。接下来，这些嵌入通过相似性函数进行比较，使得来自相同类的嵌入靠近在一起，并且来自不同类的嵌入被分离（Wang等人， 2020年）。图图4示出了通用嵌入学习模型。具体地说，在图像分类任务中，嵌入函数通常是没有全连接层的CNN，因为嵌入向量是输入数据的低维表示。我们也可以将嵌入函数称为特征提取器。相似度函数通常是距离函数，如欧几里德距离或余弦距离，这取决于所使用的模型。文献中提出了许多嵌入式学习模型其中，最为人所知的或许有：暹罗网络图五、使用三重丢失的学习过程的图示。损失的目的是最小化锚点和正极之间的距离，同时最大化锚点和负极之间的距离基于Schroff等人的图。（2015年）。现代方法。之所以选择三重网络，是因为它是第一个提出的少数学习方法之一，可以作为少数学习结果的基线。这两种模式都在下面描述2.3.1. 三重网络三重网络（TripletNet）（Schroff等人， 2015年）由一个少镜头学习模型组成，该模型使用三个图像作为输入（因此命名为三元组）：锚，积极和消极。锚点由我们要分类的图像组成接下来，正片由与锚点来自同一类的图像组成最后，底片由另一个类（不是锚的类）的图像目标是产生输入的表示，使得锚与正的相似而与负的不同由于我们使用的是图像，因此TripletNet使用CNN模型作为其特征提取器（嵌入函数）。所使用的相似性函数是平方欧几里德距离。该模型旨在以锚和正的嵌入在特征空间中彼此接近（相似），而锚和负的嵌入彼此远离（不同）的方式进行推广为此，TripletNet使用了一个名为三重损失的损失函数，由等式2描述。 1（Schroff等人， 2015年）：L. x a;x p;x n 最大.. fx a−f. x p.. 2−.. fx a−f x n.. 2α0Σð1Þ（Koch等人，2015）、Triplet Network（Schroff等人，2015）、匹配网络（Vinyals等人， 2016），原型网络（Snell等人， 2017）和关系网络（Sung et al.，2018年）。在我们的工作中，我们只使用了三重网络和原型网络。之所以选择原型网络，是因为尽管它是一种相对简单的方法，但与其他方法相比其中，f（xa）是嵌入的锚点，f（xp）是嵌入的正，f（xn）是嵌入的负，α是正负对之间的裕度三重态损失背后的思想可以在图中可视化。五、图图6示出了TripletNet模型。算法1给出了单批计算损失的伪代码见图4。通用嵌入学习模型说明。输入图像用作嵌入函数的输入。产生的嵌入通过相似性函数进行比较，得到输出。L.M. Tendon和R.A.克罗林农业人工59K1/1在训练阶段结束时，具有三元组丢失的TripletNet产生用于聚类来自同一类的实例的特征提取器为了将其用作分类器，我们通常将此模型与k-最近邻分类器（KNN）（Cunningham和Delany，2020）相结合，以训练集的嵌入作为KNN的训练样本对于来自类n的每个示例xi的嵌入。在计算原型之后，使用距离函数将嵌入的查询样本f（x）与原型进行比较。与TripletNet不同，ProtoNet可以在不添加另一个类的情况下产生输出。给定距离函数d，ProtoNet可以基于到原型的距离上的softmax来产生查询x在类上的分布（Snell等人， 2017年）：2.3.2. 原型网络公司简介exp−df x，c n2原型网络（ProtoNet）（Snell等人，2017）是少数几种学习方法中最有效的方法之一。其主要思想是，不是直接比较来自支持集的嵌入与查询集嵌入，ProtoNet为支持集中的每个类计算原型，并将查询嵌入与它们进行比较。形式上，对于支持集中的每个类n，我们计算原型cn<$1∑kf<$xi<$，其中k是射击次数，f（xi）是ð ¼ j∑n0exp−dfx，cn0其中x是查询输入数据，y是相应的标签，d是距离函数（在我们的工作中，我们使用欧几里德距离），f（x）是嵌入的查询输入，cn是类n的原型。图7示出了原型网络模型。算法2给出了使用单个查询示例的单个任务的损失计算。图第六章三重网络模型的图解。这三个输入图像被用作特征提取器的输入接下来，嵌入被用作三元组损失计算的输入，返回模型的输出。L.M. Tendon和R.A.克罗林农业人工60图第七章原型网络模型的图解。查询和支持集中的示例被用作特征提取器的输入使用嵌入的支持样本，计算支持集中每个类的原型，得到c1、c2和c3。接下来，计算嵌入式查询输入和原型之间的距离最后，距离上的softmax导致分类输出。3. 实验和结果在本节中，我们介绍并讨论了通过少数学习方法Triplet Network（Schroff等人， 2015）和PrototypicalNetwork（Snell等人， 2017）在植物胁迫分类和严重性估计的背景下。除了使用TripletNet和ProtoNet之外，我们还评估了每种方法中的几个主干（特征提取器），以评估不同特征提取器之间的对比。首先，第3.1节介绍了实验中使用的数据集接下来，第3.2节介绍了所使用的实验装置第3.3节介绍并讨论了通过实验中使用的方法获得的结果。3.1. 数据集在这项工作中使用的数据集由Krohling等人开发。（2019年）。这些数据包括受常见生物胁迫影响的阿拉比卡咖啡叶的图像这些图像是用智能手机拍摄的这些数据集分为两组：叶数据集和症状数据集。使用的数据可在GitHub下载1第1www.github.com/esgario/lara20183.1.1. 叶数据集由一组1685张图像组成，包含白色区域背景上的整个叶子区域每个图像还包含指示主要压力及其严重性的标签除健康类外，还有潜叶虫、锈病、褐斑病和尾孢叶斑病等4类生物胁迫，共5类。根据受伤面积的百分比，压力严重程度标签分为五个等级：健康（<0.1%），非常低（0.1%-5%），低（5.1%-10%），高（10.1%-10%）。15%）和非常高（>15%）。图8示出了该数据集中的图像的示例。表1给出了关于每个类的实例数的一些细节3.1.2. 症状数据集由一组2722张孤立症状的图像组成大部分症状是从原始叶片图像中裁剪出来的，总共有2147个症状图像。除此之外，Esgario et al.（2020）还使用了Barbedo（2019）提供的575张裁剪图像，总计2722张图像。与Leaf Dataset类似，除了健康类别外，还有四种生物胁迫类别：潜叶虫，锈病，褐斑病和尾孢叶斑病图 9显示了该数据集中的图像示例。表2给出了关于每个类的实例数的一些细节L.M. Tendon和R.A.克罗林农业人工61图八、叶数据集图像的示例。表1叶数据集详细信息。生物应力#图像严重度#图像健康272健康272Leaf Miner 387极低924铁锈531低332褐斑病348偏高101褐斑病147极高56共1685条共1685条3.2. 实验装置进行的实验分为三个：实验I、实验II和实验III。实验I由叶数据集中的生物胁迫分类组成。实验二包括症状数据集中的生物应激分类最后，实验三包括叶数据集的严重性估计在每个实验中，我们评估了以下几种学习模型： TripletNet 和ProtoNet。特别是，ProtoNet在5路1次拍摄和5路5次拍摄设置下进行了评估。TripletNet还使用k-最近邻算法2作为分类器，使用由网络提取的特征作为输入。对于每个少数学习模型，我们评估了用于特征提取的五个不同的主干（特征提取器）：ResNet50（He等人，2016 ）、MobileNetv2 （ Sandler 等人， 2018 ）、 VGG16 （ Simonyan 和Zisserman，2014）、DenseNet121（Huang等人， 2017），和Ef ficientNet-B4（Tan和Le，2019）。表3包含每个模型中的参数数量我们分别使用70%/15%/15%的数据集进行训练、验证和测试图像大小调整为224x224，模型在ImageNet中进行了预训练在训练阶段，在线应用随机增强模型在100个epoch上训练，使用SGD优化器（Ruder，2016），学习率等于0.01（每20个epoch衰减0.5），动量等于0.9，权重衰减等于0.0005。对于数据集中的每个图像，我们随机生成一个支持集，其中包含来自训练集的图像。为了评估模型的性能，我们计算了以下指标：准确率（ACC），精确率（PR），召回率（RE）和F1分数（F1）。由于精度和召回率指标仅针对二进制分类定义，因此我们计算了五个类的宏观平均值。我们还计算了每个epoch的平均训练时间实验在Google Colab3环境中进行，使用16GB RAM和Tesla T4GPU。所有的代码都是用Python编写的，并得到了几个开源库的帮助：PyTorch（Paszke et al.， 2019），Learn2Learn（Arnold等人， 2020）、NumPy（Harris等人， 2020）、Seaborn（Waskom，2021）、Matplotlib（Hunter，2007）和Scikit-learn（Pedregosa等人， 2011年）。这些实验中使用的源代码可以在GitHub上找到。43.3. 结果和讨论在本节中，我们将介绍在前面描述的每个实验中通过少次学习方法3.3.1. 实验I结果在第一个实验中，我们在Leaf Dataset中展示了生物胁迫分类任务中获得的结果首先，我们展示了TripletNet为每个主干所获得的表4给出了TripletNet获得的每一个epoch度量，表5包含了每一个epoch的平均训练时间。接下来，我们展示ProtoNet在5路1次和5路5次设置中获得的结果表6列出了两种ProtoNet设置获得的性能指标，表7包含每个epoch的平均训练时间。为了便于可视化通过少次学习方法获得的每个类的准确度，我们还在图中提供了TripletNet，5路1次ProtoNet和5路5次ProtoNet的混淆矩阵。 10. 我们只展示了每种方法中具有最高准确度的骨干所获得的混淆矩阵为了可视化模型的输出嵌入，我们还在图11中提供了TripletNet，5路1-shot ProtoNet和5路5-shot ProtoNet的散点图。这些图是通过使用t分布随机邻域嵌入（t-SNE）将测试折叠输出嵌入减少到二维空间中获得的（Van der Maaten和Hinton，2008）。用于生成可视化的t-SNE参数是scikit-learn库中的默认值。5讨论分析表4中的TripletNet结果，我们观察到所有骨干都达到了93.25%至95.24%的高准确度。总体上最好的主干是MobileNetv2和VGG16，准确率为95.24%。然而，MobileNetv2比VGG16具有更好的召回率和F1查看表5中的训练时间结果，2我们测试了k=5，10，15的值，由于结果相似，我们只显示了k=53colab.research.google.com4www.github.com/lucastassis/pg-coffee5 https://scikit-learn.org/stable/modules/generated/sklearn.manifold.TSNE.htmlL.M. Tendon和R.A.克罗林农业人工62图第九章症状数据集图像的示例。还观察到MobileNetv2具有最短的训练时间，每个时期的平均训练时间为40.03秒，而VGG16获得的训练时间为67.83秒在ProtoNet获得的结果中，如表6所示，我们观察到与TripletNet相比，该方法的平均准确度略高5 路1 次射击设置中最好的骨干是ResNet50（尽管VGG16和DenseNet121获得了相同的准确性，但其余指标比ResNet50提供的指标更差），准确率为95.63%。至于5路5拍设置，MobileNetv2在每个指标上都获得了最好的结果，准确率为96.03%。关于训练时间，MobileNetv2获得了最短的，在5路1次和5路5次设置中分别为14.29秒和28.24秒分析图10中的混淆矩阵，我们观察到所有模型在检测具有褐色叶斑病的叶片中获得100%的准确度。健康、潜叶虫和褐斑病类别的结果也很高。在尾孢叶斑病类中获得的准确率最低，在所有少镜头学习方法中的准确率值为67%。该结果与Esgario等人（2020）的工作一致，其中在同一类别中由于该病变与其他病变的相似性或由于不平衡的数据集，该结果可能是公正的与Esgario等人（2020）的工作的一个区别是，他们在健康叶片中获得了100%的准确性，而我们在褐斑病中获得了准确性。调查这一点，似乎是因为输入图像模糊导致生物胁迫的一些失真，并且少数镜头学习方法是基于比较的方法，一些锈病病变可能变得太小并且无法与健康的叶子区分开。散点图如图所示。关于t-SNE嵌入可视化的图11显示骨架能够很好地概括，具有关于尾孢叶斑类的一些错误，其与其他类的聚类具有更高的交叉。Esgario等人报告的最佳结果。（2020）在使用叶数据集的生物胁迫分类任务中的识别率为95.63%，使用ResNet50作为分类器。这个结果与我们的结果相似，带有MobileNetv2主干的5路5次ProtoNet甚至略优于它，准确率为96.03%。3.3.2. 实验II结果在第二个实验中，我们在症状数据集中展示了生物应激分类任务中获得的结果首先，我们展示了TripletNet为每个主干所获得的结果表8显示了TripletNet获得的性能指标，表9包含每个epoch的平均训练时间接下来，我们展示ProtoNet在5路1次和5路5次设置中获得的结果表10显示了两种ProtoNet设置获得的性能指标，表11包含每个epoch的平均训练时间。为了便于可视化通过少次学习方法获得的每个类的准确度，我们还在图中提供了TripletNet，5路1次ProtoNet和5路5次ProtoNet的混淆矩阵。 12个。我们只展示了每种方法中具有最高准确度的骨干所获得的混淆矩阵为了可视化模型的输出嵌入，我们还在图中提供了TripletNet，5路1-shot ProtoNet和5路5-shot ProtoNet的散点图。 13岁表2表3每个模型中的参数数（M）骨干参数（M）ResNet5025.56MobileNetv23.4VGG16138.36DenseNet1217.97Effi cientNet-B419症状数据集详细信息。生物胁迫图片数量健康256叶蝇593锈991褐斑病504褐斑病378总2722L.M. Tendon和R.A.克罗林农业人工63表4在实验I中通过三重网络获得的性能指标。TripletNet结果骨干ACC（%）PR（%）RE（%）F1（%）ResNet5094.0592.2188.9690.17MobileNetv295.2494.6291.4592.71VGG1695.2495.1290.6992.25DenseNet12193.2592.2387.1488.64Effi cientNet-B493.6591.7387.4988.85讨论观察表8中的TripletNet结果，我们可以注意到，该方法再次获得了94.63%至96.42%的高准确度特别是MobileNetv2骨干取得了最好的结果，准确率为96.42%，精确率为96.24，召回率为96.54%，F1得分为96.38%。最好的平均时间也来自MobileNetv2。其他骨干网，如ResNet 50，DenseNet 121和Ef ficientNet-B4也获得了与MobileNetv 2接近的结果。VGG16在所有骨干中得分最差分析表10中的ProtoNet结果，我们观察到所有主干都具有良好的性能，在5路1次设置中的最佳准确率为96.72%，在5路5次设置中为96.42%虽然预计更多的发射次数将转化为更高的准确度，但我们在1次发射设置中获得了更高的平均准确度。我们理解这是由于这样的事实，即由于症状数据集只包含少量的类，特征提取器不需要每个类都有很多支持示例就可以很好地泛化。它还表明，每个类的单个样本包含该类的所有代表性特征仅考虑在5向1次射击设置中获得的结果，我们观察到EfficientNet-B4在每个度量中的得分都超过了每个骨干，准确率为96.72%，精确率为95.73%，召回率为96.91%，F1得分为96.72%。然而，查看表11中的结果，我们观察到该骨干具有最大的训练时间，平均每个epoch为37.68s相比之下，ResNet50和MobileNetv2分别在21.28秒和16.28秒内获得了96.12%和96.42%这些精度与Ef ficientNet-B4获得的精度相当特别是，MobileNetv2在准确性和每个epoch的平均时间方面有很大的权衡。与ResNet50和MobileNetv2相比，DenseNet121和VGG16获得了较低的准确性结果，并且具有更长的训练时间考虑到在5路5次激发设置中获得的结果，我们观察到在该设置中ResNet50具有最佳性能。主干获得了96.42%的准确率，96.24%的精确度，96.27%的召回率和96.25%的F1-ScoreEfficientNet-B4（96.11%）和MobileNetv2 （ 95.82% ）分别获得了第二和第与单次设置的结果类似，MobileNetv2和ResNet50在准确性和训练时间之间具有最佳权衡。分析图中的混淆矩阵。 12，我们观察到所有模型在分类健康叶片时获得100%的准确率。在尾孢叶斑类中获得最低的准确度，准确度值范围为90%至94%。对褐斑病分类的准确率较低，这一表6在实验I中通过原型网络获得的性能指标ProtoNet结果5路1次值得注意的是，在生物应激分类任务中获得的结果在症状数据集中比在叶数据集中获得的结果更好这与Esgario等人（2020）和Barbedo（2019）提供的结果一致。由于症状数据集中的图像只关注病变本身，因此网络检测感兴趣区域的任务更容易例如，在叶数据集中，网络必须处理叶中的背景和非损伤区域，这使得分类任务更加困难。散点图如图所示。 11关于t-SNE嵌入可视化显示主干能够很好地泛化。注意，在该实验中，聚类具有比实验I中呈现的聚类更少的交叉，这与更好的分类分数相证实Esgario等人报告的最佳结果。（2020）生物应激使用症状数据集的分类任务为97.07%，使用ResNet50作为分类器。这一结果与我们的结果（96.72%）相似这种差异约为0.35%，这可能是由于训练差异。3.3.3. 实验III结果在第三个实验中，我们展示了在叶数据集中的严重性估计任务首先，我们展示了TripletNet为每个主干所获得的表12列出了TripletNet获得的性能指标。由于该实验使用了Leaf Dataset，因此每个epoch的平均训练时间结果与实验I相似。因此，每个epoch的平均训练时间分别与TripletNet和ProtoNet的表5和表7相同接下来，我们展示ProtoNet在5路1次和5路5次设置中获得的结果表13包含两个ProtoNet设置获得的性能指标为了便于可视化通过少次学习方法获得的每个类的准确度，我们还在图中提供了TripletNet，5路1次ProtoNet和5路5次ProtoNet的混淆矩阵。 14个。我们只展示了每种方法中具有最高准确度的骨干所获得的混淆矩阵表5实验I中的三重网络的每个时期的训练时间表7实验I中原型网络的每个时期的训练时间每个Epoch的TripletNet训练时间（s）每个Epoch的ProtoNet训练时间（s）骨干时间（秒）骨干5路1拍五向五射ResNet5052.97ResNet5020.7535.43MobileNetv240.03MobileNetv214.2928.24VGG1667.83VGG1634.6562.24DenseNet12170.07DenseNet12128.2359.71Effi cientNet-B4101.87Effi cientNet-B441.5287.28骨干ACC（%）PR（%）RE（%）F1（%）ResNet5095.6395.7291.9493.36MobileNetv294.4492.3291.3691.80VGG1695.6395.0791.6493.02DenseNet12195.6394.7491.9493.04Effi cientNet-B494.4492.5389.5490.63五向五射骨干ACC（%）PR（%）RE（%）F1（%）ResNet5094.8493.3891.2592.14MobileNetv296.0396.1292.2193.70VGG1694.4492.9590.2491.31DenseNet12195.6395.7291.8793.32Effi cientNet-B495.2494.0092.0592.89L.M. Tendon和R.A.克罗林农业人工64图10. 通过实验一中的少样本学习方法获得的混淆矩阵。为了可视化模型的输出嵌入，我们还在图中提供了TripletNet，5路1-shot ProtoNet和5路5-shot ProtoNet的散点图。 15个。讨论分析表12中的TripletNet结果，我们观察到严重程度估计任务的平均准确率低于先前实验中的平均准确率，准确率范围为86.11%至91.27%。结果表明，MobileNetv 2的准确率为91.27%，精确率为88.25%，召回率为86.57%，F1得分为87.32%。MobileNetv2也有一个较低的训练时间，每epoch。在精确度、召回率和F1分数上的较低分数这是由于不平衡的数据集。

下载后可阅读完整内容，剩余1页未读，立即下载