基于图像的鱼病检测中的机器学习技术

120 浏览量更新于2024-01-18 收藏 1.76MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

沙特国王大学学报基于图像的机器学习技术在水产养殖鱼病检测中的应用Shoaib AhmedMd，Tanjim Taharat Aurpa，Md.阿布·卡拉姆·阿扎德孟加拉国，达卡，萨瓦尔，贾汉吉尔纳加尔大学阿提奇莱因福奥文章历史记录：2020年12月31日收到2021年5月2日修订2021年5月9日接受2021年5月19日网上发售保留字：鱼类疾病水产图像处理机器学习支持向量机A B S T R A C T水产养殖中的鱼病对营养安全构成重大危害由于缺乏必要的基础设施，在水产养殖的早期阶段发现受及时发现病鱼是防止疾病传播的必要措施在这项工作中，我们希望找出水产养殖中的鲑鱼疾病，因为鲑鱼水产养殖是全球增长最快的食品生产系统，占市场的70%（250万吨）。在完美的图像处理和机器学习机制的联盟中，我们识别出由各种病原体引起的感染鱼类。这项工作分为两部分。在初步的部分，图像预处理和分割已被应用到减少噪声和夸大的图像，分别。在第二部分中，我们提取所涉及的特征，以分类疾病的支持向量机（SVM）算法的机器学习与核函数的帮助第一部分的经处理的图像已经通过该（SVM）模型。然后，我们协调了一个全面的实验与建议的技术组合的鲑鱼图像数据集用于检查- ine鱼病。我们在一个新的数据集上传达了这项工作，该数据集在有和没有图像增强的情况下进行了妥协。实验结果表明，我们所应用的支持向量机具有显著的分类效果，91.42%和94.12%的准确度，分别有和没有增强。版权所有©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍水产养殖这个词与固定有关，包括繁殖、饲养和收获鱼类、水生植物、甲壳类动物、软体动物和水生生物。它涉及在受控条件下培养淡水和咸水生物，并用于生产食品和商业产品，如图1所示。主要有两种类型的水产养殖。第一种是海水养殖，其是养殖海洋生物用于食品和其他产品，如药品、食品添加剂、犹太人（例如，养殖珍珠）、保健品和化妆品。海洋生物要么在自然海洋环境中养殖，或在陆基或海基围栏中，例如笼子、池塘或跑道中。海藻、软体动物、虾、海洋鱼类，*通讯作者。电子邮件地址：shoaibmehrab011@gmail.com（M.S. Ahmed）。沙特国王大学负责同行审查目前，世界各地的海岸线上养殖着各种各样的生物，其中包括海参和海马等一系列其他次要物种它有助于可持续的粮食生产和当地社区的经济发展。然而，有时大规模的海洋固定会对海洋和沿海环境构成威胁，如自然栖息地、营养物质和废物排放的退化，外来生物的意外释放，疾病对野生种群的传播，以及当地和土著社区的迁移（Phillips，2008年）。第二种是养鱼，即在人造水箱和其他封闭物中为商业目的养殖鱼类。通常，一些常见的鱼类，如鲶鱼，罗非鱼，鲑鱼，鲤鱼，鳕鱼和鳟鱼都固定在这些围栏中。如今，渔业养殖业已经发展到满足对鱼类产品的需求（Winkler，2020年）。这种形式的水产养殖是广泛的很长一段时间，因为它是说，生产廉价的来源蛋白质。全球水产养殖是增长最快的食品生产之一，截至2020年，占所有鱼类和无脊椎动物产量的近53%，占海藻总产量的97%。据估计，2019年全球养殖鲑鱼产量增长了7%，市场https://doi.org/10.1016/j.jksuci.2021.05.0031319-1578/©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。制作和主办：Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页：www.sciencedirect.comMd Shoaib Ahmed、Tanjim Taharat Aurpa和Md. 阿布·卡拉姆·阿扎德沙特国王大学学报5171Fig. 1.《传染病》（2020）。（与大西洋鲑鱼价格过山车搏斗，2020年）。全球鲑鱼水产养殖面临着各种疾病的威胁，这些疾病可能会破坏鲑鱼的常规生产。疾病对自然环境和水产养殖中的鱼类都有危险的影响疾病是全球公认的对水产养殖经济成功的最严重警告之一。鱼类疾病是由一系列广泛的传染性生物体引起的，细菌是导致封闭鱼类传染病的原因（Miller和Mitchell，2009年）。传染病对水产养殖业的胜利构成了最重要的威胁之一。大量的鱼类聚集在一个很小的区域，形成了一个有利于发展的生态系统，并迅速传播传染病。在这种拥挤的情况下，一个相对人造的环境，鱼类受到压力，也对疾病作出反应此外，水生态系统和水流不足使病原体更容易在聚集的人群中传播（Nicholson，2006）。疾病的检测与一些图像处理的配合可以帮助提取良好的特征。图像分割是计算机视觉、人工智能等研究领域中不可或缺的技术。k均值分割是一种流行的图像处理技术，它主要分割图像中的不同区域而不丢失信息。在Kailasanathan等人（2001年）中，作者将k均值分割应用于图像的认证。Gaur和Yadav（2015）展示了k均值分割的另一个应用，他们使用这种技术来识别手写的印地语字符。支持向量机（Support Vector Machine，SVM）是目前最流行的有监督机器学习技术之一，它为各个领域中的许多分类问题带来了方便的解决方案。它是一个强大的分类工具，可以为未标记的数据带来质量预测。在Khan等人（2016）中，作者基于三个核函数构建了一个SVM模型，以区分登革热感染的人血清和健康血清。对于图像分类，Agarap（2017）提出了另一种SVM架构，他们通过将卷积神经网络（CNN）与SVM相结合来模拟该架构。SVM在许多情况下提供了显着的准确性。在本文中，我们进行了我们的研究，鲑鱼疾病分类，无论是鱼有没有感染，与机器视觉为基础的技术。功能集是一种权衡，疾病的分类。利用图像处理技术从图像中提取特征，然后采用支持向量机（SVM）对传染病进行分类。在此，我们总结了整个概念，这项工作提出了一种基于机器学习模型（SVM）的鱼病检测的突破性框架。评估和分析我们提出的模型的性能，有和没有图像增强。通过一些评价指标，将我们提出的模型与性能良好的2. 相关工作有些研究工作只侧重于一些基本的图像处理技术，用于鱼病的识别。Malik等人（2017）提出了一种基于图像的检测技术，首先将图像分割应用于Canny，Prewitt和Sobel的边缘检测。然而，他们没有具体说明用于特征提取的确切技术。在特征提取中，他们应用梯度直方图（HOG）和加速分段测试（FAST）特征，结合两种技术进行分类。他们试图用一种组合来发现一种更好的分类，而不是应用一种不太准确的特定方法。另一种技术Lyubchenko et al.（2016）提出了一种称为图像中对象聚类的结构，该结构基于各种聚类的规模强制执行不同的图像分割操作。在这里，他们为单个对象和遇到特定标记的对象选择标记。最后，他们计算图像中物体的比例以及感染区域与鱼体的比例，以识别鱼病。然而，对物体进行单独标记既费时又无效。有一些方法专注于图像处理和机器学习的整合。Malik 等人（2017）提出了一种称为流行性溃疡综合征（EUS）的特定鱼类疾病检测方法。入侵丝囊菌是引起该病的一种真菌病原在这里，他们采用了将主成分分析（PCA）和定向特征直方图（HOG）与来自快速分段测试（FAST）特征检测器的特征相结合的组合风格，然后通过机器学习算法（神经网络）进行分类FAST-PCA-NN的序列通过分类器给出了86%的准确率，HOG-PCA-NN给出了65.8%的准确率，低于之前的组合。Verma等人（2017）提出了一个敏感的主题，即肾结石检测。在本文中，作者应用形态学操作和分割，以确定感兴趣的区域（区域）的支持向量机分类技术。在应用该技术后，他们研究了肾结石图像，但存在一些困难，例如肾结石的相似性和图像分辨率低。Zhou等人（2017）介绍了一种无设备的当前检测和SVM辅助定位。这里，检测算法可以通过使用CSI（信道状态信息）指纹的SVM分类器来检测人的存在。硬件检测中的特洛伊木马（Inoue等人，2017）依赖于基于SVM的方法。在这里，作者评估了木马检测方法与他们设计的硬件。对于SVM分析，它们的网表由三种类型的具有正常和异常行为的硬件木马组成。我们可以得出结论，没有人就上述研究义务对鲑鱼疾病分类进行过任何深入的研究工作。此外，目前的研究工作大多涉及典型的鱼病分类，而没有涉及水产养殖中的鱼病分类.所有这些描述的技术仅依赖于图像处理或图像处理和机器学习技术的组合，但不符合标准。3. 初步和拟议框架本节有几个阶段，如图2所示。本文简要介绍了鲑鱼疾病分类的相关技术和解决方案框架.●●●Md Shoaib Ahmed、Tanjim Taharat Aurpa和Md. 阿布·卡拉姆·阿扎德沙特国王大学学报5172Xfginfg图二. 建议的框架（从输入到结果逐步对我们建议的工作进行的总体分析）。3.1. 三次样条插值原始图像以各种大小出现在数据集中。如果我们在训练分类器之前不调整这些图像的大小，分类器的效率可能会降低。当我们从不同的来源收集这些图像时，我们在将它们应用于分类器之前对其进行整形。对于图像放大和固定尺寸转换，我们使用称为扩展三次样条插值的改进插值方法（AbdHamid等人， 2010）。对于有限区间½a;b]，n-1SxCiEB3;xs ½x0;xn]2I¼-3其中Ci是未知的实系数。由于C i EB3;ix在 1/ 2xi;xi4]上有一个支持，因此在每个x i处有三个非零基函数：C i EB3;i-3x;C i EB3;i-2x;C i EB3;i-1x。3.2. 自适应直方图均衡为了提高图像设xni 1/40是具有稳定步长h的过渡的分区。是一项基本技术。它有助于恢复丢失的信息-我们使用Eq.1.一、h<$b-a;x0¼a;x i¼x0ih;I¼1;2;3;.. .ð 1Þ给定xi，扩展三次B样条函数，Sx是等式中的扩展三次B样条基函数二、在图像中。由于放大和缩放图像，某些图像可能会丢失信息。为了防止这个问题，我们使用自适应直方图均衡化并增强每个图像的对比度。自适应直方图均衡（AHE）是一种用于增强图像对比度的视觉处理方法。在这里，我们使用AHE的扩展，称为对比度限制自适应直方图等于-Md Shoaib Ahmed、Tanjim Taharat Aurpa和Md. 阿布·卡拉姆·阿扎德沙特国王大学学报5173YYn3YYn116我-cj？Xn YnKn-¼-化（CLAHE）（Liu等人， 2019年）。CLAHE在对比度限制方面不同于常规AHE一个用户定义的值，称为裁剪限制，其中CLAHE通过裁剪直方图来限制增强。直方图中的噪声量取决于限幅电平。此外，平滑度和对比度的增强也依赖于此限幅水平。也可以应用称为自适应直方图剪辑（AHC）的有限对比技术的修改。AHC动态地校准图像的背景区域的剪切水平和平衡的过度增强（Hitam等人， 2013年）的报告。在这里，我们使用一个AHC称为瑞利分布，形成一个正常的直方图。当量3表示该功能，如下所10：5和Yadav（2015）以及Hartigan和Wong（1979）坚持常规步骤来满足主要意图，即将图像对象聚类成K个不同的组。k-均值聚类技术的步骤如下.1. 确定聚类总数k。2. 在每组中，选择k个点作为质心。3. 将每个数据点指定到组装k个聚类的最近质心。4. 计算并分配每个簇的新质心5. 当发生任何重新分配时，转到步骤4，该时间将每个数据点重新分配到最近的质心。否则，模型就准备好了。瑞利 p/p最小值为1/2，最大值为1/2，最大值为1/2，最大值为1/2，最大值为1/2，Qf]ð3Þk-均值聚类技术（de Oliveira其中pmin和Qmin分别表示最小像素值和a是非负实数标量指示分布参数。在这个实验中，我们设定0.01Martins等人，2009）是最小平方结构，XXj联系我们3.3. RGB颜色空间到L*a*b颜色空间我们现在将自适应直方图均衡化图像从其中J是目标函数，其显示特定组中包含的n个对象的相似性行为。k和n是数字的集群和number的案件，分别最后，是从点xj到质心的距离函数RGB到L*a*b。因此，我们使用k-均值聚类对段a-i-i图像的分割，这里的k均值聚类技术在L*a*b颜色空间而不是RGB颜色空间中有效地分割图像（Burney和Tariq，2014）。在L*a*b颜色空间中，其中L表示图像的亮度，并且a、b颜色通道描绘其他颜色组合（Rahman等人， 2016年）。对于这种转换，我们需要从RGB颜色空间转换到XYZ颜色空间（Hel-Or，2020; Bianco等人，2007年，根据Eq。四、C组J。这里，从鱼的感染区域获取两种类型的特征向量，即，共现和统计。我们将在实验评估部分详细解释某些特性。3.5. 支持向量机2X 320：412453电话：+86-021 -8888888传真：+86-021 - 888888882R3我们利用前面小节中讨论的特征向量64Y75¼640：212671电话：+86-021- 88888880：07216975ω64G754Z019334119193- 119193 -119193B关于SVM支持向量机（SVM）是一种有监督的机器学习算法用于许多分类问题现在，根据等式 [5-8] 将 XYZ 颜色空间转换到 L*a*b 颜色空间（Acharya，2002）8 .第八条。Σ1因为它的准确率更高。它的目的是在不同的类之间构造一个超平面，并带有一个边界来对对象进行分类。超平面可以在多维轴中构造以划分数据点（Meyer等人，2003; Noble，2006）。图 3 indi-给出了支持向量机的基本图一些Lω¼>116Yn>：903：3Y- 十六岁如果Yn 粤ICP备05018886号-1如果Y60：008856ð5Þ与SVM相关的常见术语如下：最优超平面：区分两个具有最大间隔的类的边界是最优超平面。它是N维表面的N-1维子集，aω<$500fX-fYbω<$200ΩfYfZð6Þð7Þ在那个曲面上的类。在二维空间中，超平面是一条直线。随着维数的增加，超平面的维数也随之增加。最优超平面为确定为wxib0。这里w是权重向量，x是Yn其中，输入特征向量，b是偏置。对于训练集的所有方面，w和b符合以下不等式（Suthaharan，2016）：8t1如果t>0：008856wxbP1，如果y¼1>3我我f>：7：787吨16如果测试60：008856ð8Þwx ib61if yi1支持向量：更接近目标影响超平面的定位的向量称为支持向量。越多的相似点，3.4. k-means聚类分割当我们在鱼的图像中分割受感染的部分时，分类器学习准确地识别受感染的鱼的图像。在这一小节中，然后利用k均值聚类技术将转换后的图像分割成几个区域。因此，它将感染区域与鱼类的图像分开。技术在Gaur两个类成为支持向量。这些要点有助于SVM的建立。假设标记的训练数据集表示为fxxi;yi ji^l; 2;. 其中xi是特征向量表示或输入，yi是类标签或输出。为了考虑两类点之间的裕度最大化，利用拉格朗日技巧对原问题进行改进，通过等式（1）确定函数的最大值。10个。20.04作为瑞利分布中的a值功能J¼ð9Þ-Md Shoaib Ahmed、Tanjim Taharat Aurpa和Md. 阿布·卡拉姆·阿扎德沙特国王大学学报5174KA类B类最大间距支持向量图三. 支持向量机（发现最优超平面和最优超平面的类分离）。Qasumkai-Xaiajyxi：y10加权模型用于训练特征向量，1/1i;j¼1i j j在构建阶段中使用相应的标签。建设阶段的产物包括训练有素的或其中ai是每个片段的倒数乘数。然后通过如等式所示的核函数Kxi;yj将十一岁学习SVM模型。该训练模型用于在部署阶段对任何进入的鱼进行分类。在部署阶段，一些步骤执行如下。K KQaXai-XaiajyyKxi：y11● 将任何鱼图像的输入提供到系统中，然后1/1i j ji;j¼1图像是通过图像处理技术的系列化来细化的。Margin：Margin是由超平面分隔的两个非重叠类之间的间隙。它主要表示数据点与分界线之间的差距。对于最优超平面，我们要求最大的余量。核函数：SVM算法用于分类对象的函数它们主要是将输入转换成所需的形式，以方便地构造超SVM中使用了许多内核（Zhang，2015），例如线性，多项式（齐次和异构），高斯，Fisher，图形，字符串，树等。线性核是用于线性可分离数据点的最常用和最直接的核函数之一（Ben-Hur和Weston，2010）。在许多应用领域， SVM 通常以高精度优于任何其他分类器（Chandra和Bedi，2018）。它主要是为我们在这里解决的二进制分类问题而设计的。SVM使用特征训练数据集进行训练，以在测试数据集中获得稳健的性能。对于性能分析，我们需要评估实验评估部分中显示的一些指标。3.6. 系统架构我们修饰了图4所示的系统架构。它包含两个阶段，第一个是构建阶段，第二个是部署阶段。在构建阶段，我们将标记的图像作为训练数据进行处理。● 每个图像都是通过上述序列化进行改进的在图像分割方面，利用K-均值聚类技术获得了两类特征向量从特征提取器，特征向量被馈送用于训练的SVM模型。最后，结果是输入图像的标签，以将特定类别分类为新鲜或受感染的鱼。该系统架构展示了从数据获取到模型训练和类预测4. 评价本节详细描述了实验干预，以评估我们提出的方法。在此评估中，我们提取的功能与统计和灰度共生矩阵（GLCM）与适当的类似条款利用我们的鱼图像数据集。对于分类结果，我们需要一些性能评估指标来显示预测新数据的操作能力。4.1. 环境规范在这里，我们使用MATLAB1作为多范式编程语言和Python的组合。对于图像处理任务，如三次样条插值，自适应直方图均衡化，以及从RGB到L*a*b的图像转换，我们使用MATLAB。然后，在GoogleColab2平台上使用Python进行特征提取和SVM模型的训练。图像判读和分类图像处理技术，如三次样条插值、自适应直方图均衡化以及将RGB颜色空间转换为L*a*b颜色空间。采用K-均值聚类技术对图像进行分割，识别出两类特征向量，即共生矩阵特征和统计特征。● 利用这些特征向量进行SVM的进一步处理。这需要巨大的计算能力。因此，强大的计算工具安装额外的硬件支持是昂贵的。因此，我们使用Google Colab平台，该平台为我们提供云端上的高端CPU和GPU，第1https://www.mathworks.com/solutions/image-video-processing.html2https://colab.research.google.com/A类B类●●●●Md Shoaib Ahmed、Tanjim Taharat Aurpa和Md. 阿布·卡拉姆·阿扎德沙特国王大学学报5175PP2P见图4。系统架构（一个规范的图表，展示了从数据采集到模型训练和类预测的整个过程）。用更少的时间有效地训练我们的模型。安装必要的软件包没有额外的负担，因为该平台使用了培训过程中使用的所有强制性软件包（Bisong，2019）。Google Colab搭载NVIDIA K80，配备12 GB GPU内存和358GB磁盘空间。这种修饰的环境为训练机器学习模型提供了巨大的计算能力。4.2. 实验数据集矩阵（GLCM）功能的基础上解释鱼病。统计特征描述如下。Mean（l）：假设感染区域中有P个像素，新鲜区域中有Q个像素，并且感染区域中像素的灰度颜色强度为w，则平均值l表示为以下等式：12个。Xwi由于没有鲑鱼新鲜和感染的数据集，鱼，我们准备了一个shibboleth和新的数据集l¼i¼1ð12 Þ大多数来自水产养殖公司。数据集包含新鲜和感染的鲑鱼的图像，如图5所示。我们总共收集了266张图像，用于训练和验证我们的模型。为了训练和测试，我们的数据集具有表1中描述的训练数据和测试数据的比例。训练和测试图像的总数分别为231和35，分别标准偏差（r）：假设在感染区域中存在P个像素，其中像素的灰度颜色强度表示w，并且所有像素的平均灰度颜色强度表示l。标准偏差r定义为以下等式：13岁sPPwi-l2因此，我们的数据采集是一个复杂的过程。我们应用我们数据集中的图像增强技术，1Pð13 Þ数据集。在这里，我们使用image_argumentor3工具进行一些图像增强操作，如水平Fip（fliph），垂直Flip（flipv），旋转（rot），像素移位（transs）和缩放（zoom）。在增强操作之后，我们感知到表2中描述的1，105个训练图像。训练和测试图像的总数分别为1，105和221。方差（r）：如果在感染区域中存在P个像素，像素的灰度颜色强度和所有像素的平均灰度颜色强度表示l和w，则方差r2被定义为以下等式：十四岁Xwi-l24.3. 特征提取r2¼i¼1ð14 Þ我们考虑两种类型的特征提取技术：一种是统计特征，另一种是灰度共生3https://github.com/codebox/image_augmentor。● 峰度（j）：假设在感染区域中存在P个像素，其中w和l分别表示像素的灰度颜色强度和所有像素的平均灰度颜色强度，则峰度j被定义为以下等式：十五岁●●●PMd Shoaib Ahmed、Tanjim Taharat Aurpa和Md. 阿布·卡拉姆·阿扎德沙特国王大学学报5176X X2XXXXXXXXn¼Xw-lP我FGa;b;一B2我¼2. 0i¼ 1X1X图五、三文鱼（来自我们数据集的两个新鲜鱼和受感染鱼样本表1总体数据集分割（未经增强的新鲜和受感染鱼类图像的总数）。GL-1GL- 1对比度Ci-jMi;j18联系我们GL-1GL- 1i：j：Mi;j-la：lb联系我们相关性v¼GL-1GL- 1ra：rbð19 Þ表2总体数据集分割（具有增强的新鲜和受感染的鱼图像的总数）。鱼训练图像测试图像新鲜的鱼320 64受感染的鱼785 157共计1 105 221能量f<$Mi;j220联系我们GL-1GL- 1熵D1/4-Mi;jlogMi;j 21联系我们GL-1GL- 1均匀性Mi;ji0j01i-j2Pð22 Þ1XX XW-1X4¼¼这里，l lr和r是预期值和方差值的和第1页P12P1/12-3小时15分钟分别用于行和列条目。4.4. 拟议分类器● 偏度（c）：这里，平均值为l，标准偏差为r，众数为qm，表示感染区域中所有像素的灰度颜色强度。然后，偏度c被定义为以下等式。十六岁l-qm在这里，我们利用线性SVM的不可分离鞘作为我们的分类器。由于训练图像和测试图像（没有增强）的总数分别为231和35，培训数据集是fx1;y1;fx2;y2;. ;x231;y231g，其中xi1;r;r2;j;c;C;v;f;D;n是输入向量，yi1。的cr16除了这些统计特征，这里还使用了大量的GLCM特征。这些方法便于提取纹理特征，从图像中提取。通过研究两个人倒数乘数a1;a2;. ;a231如下面的等式23所示。35 35Qaai-aiajy y xi xj231/1i;j¼1如果每次测量像素，则可以执行对像素处的强度多样性的评估。让我们假设fa;b是二维的数字图像X×Y像素和灰度级G.我们还假定， Þ受限制1. P35aiyi¼06C为i1 235L116ai¼; ;.. ;和a2;b2是fa;b中的两个像素，距离为D，角度为尺寸和纵坐标之间的距离是h。所以，一个GLCMM;i;j;D; h;i;j描绘为以下等式：十七岁Mi;j;D;hjfa1;b1;b2sX×Y：D;h;fa1;b1gj17在这个实验中，我们使用了五个GLCM特征，即对比度（C），相关性（v），能量（f），熵（D）和均匀性（n）。这些被表示为下面的等式18至22。其中C是用作i的上限值的非负参数。C参数被确认为惩罚参数。C参数为所有错误分类的数据点附加惩罚。C的低值标识错误分类的低点。因此，采取大幅度的决策边界是以牺牲更多的错误分类。而重要的鱼训练图像测试图像鲜鱼6815感染的鱼16320总23135Md Shoaib Ahmed、Tanjim Taharat Aurpa和Md. 阿布·卡拉姆·阿扎德沙特国王大学学报5177N产品介绍Þ产品介绍Þ产品介绍ÞXjj产品介绍Þ产品介绍Þ产品介绍Þ我预测总数产品介绍Þ我值，SVM试图减少错误分类的数量，从而导致更小的边缘决策边界。在这里，我们通过训练过程解决所有SVM参数，并为C应用一个重要的数值。我们在我们的工作中使用了线性内核，从我们应用的四个内核，即线性，sigmoid，多项式和高斯。从这些，我们已经看到，精度变化可以忽略不计的量，线性内核在很短的时间内表现令人满意。4.5. 绩效评估我们根据几个指标来评估我们训练的SVM模型的外观为了预测新的数据或图像，我们使用混淆矩阵来设想我们的模型混淆矩阵包括四个构建块，即真阳性（TP）、真阴性（TN）、假阳性（FP）和假阴性（FN）。TP和TN指的是预测正确和错误的情况。 FP指的是正错误预测，FN指的是负错误预测（Marom et al.，2010年）。我们从混淆矩阵中计算出更多不同的指标来评估我们的模型。这些精确的指标是准确度、精确度、召回率或敏感度、特异性和F1评分，这些是通过应用以下公式计算的。准确度：准确度是评价指标之一，并在等式中进行了非正式解释。24岁它是特定分类的鱼类与测试集中鱼类总数XPi我（假阴性率）和TPR（真阳性率）通过以下等式30至32计算。FPRFP100 30FP-100FN100 31FNFUNTPTPRTP100 32TPFFN我们使用受试者工作特征或ROC曲线进行额外评估。我们可以通过ROC曲线的值来估计ROC曲线下面积（AUC）（Bradley，1997）。根据Eqs. 30和32生成ROC曲线。ROC曲线可以很容易地计算出模型或分类器区分类别的性能。 AOC越高意味着分类器或模型预测的越好5. 实验结果本节触摸我们的SVM模型结果，以检查我们模型的鲁棒性，并查看我们在常规和增强数据集中使用的技术的结果。在这里，我们提出了实际的结果和比较与一些图形表示和表格。首先，对具有任意维度的输入图像进行转换和放大，×精度N×100%24小时QI我固定大小为600的磁盘250像素根据我们的亲-构成框架。然后将图像分割成各种区域利用k-均值聚类技术。因此，鱼的图像很容易识别感染和新鲜的区域。在这种分割之后，感染区域更加复杂-其中，PNPi是正确预测的数量，PNjQij是正确预测的数量。对于二进制分类，准确度也可以计算如下与方程。二十五精度TP100 25TPTNFPFN其中，TP=真阳性，TN=真阴性，FP=假阳性，FN=假阴性。精度：分类鱼类（TP）和基础事实（TP和FP之和）的命题定义了精度。它计算准确分类的鱼类的百分比为Eq。26岁PrecisionTP 100 26公司简介回忆或灵敏度：分类鱼（TP）与地面实况鱼的比率（TP和FN的总数）定义为等式。27岁。召回或灵敏度TP100 27TPFFN特异性：TN的比值以及FP和TN的总和确定特异性，公式为28。特异性TN100 28FP-100F1得分（F-测量）：该度量被计算为精确度和召回率的对称平均值（Minh等人， 2017）作为以下等式29。2ω精度ω召回率有能力。所有提到的方面都在图中示出。六、5.1. 建议SVM我们提出的SVM分类器的分类评估在表3（具有增强）和表4（没有增强）中描述。这里，两个表仅包括让步两个类别的SVM分类器：鲜鱼和感染的鱼。在表3中，对于鲜鱼类，高百分比显示灵敏度为98.46%，而准确度为92.0%。准确度、F1评分和特异性分别为92.75%、95.52%和50.00%。在受感染的鱼类中，F1评分的百分比最高，为96.02%。在这里，准确率为93.50%，召回率为98.13%。表4显示了鲜鱼类中93.75%的准确度和感染鱼类中94.90%的准确度。在新鲜和感染的鱼类中，它还显示出良好的F1得分，分别为96.23%和97.08%。我们清楚地观察到表3和表4，其中感染鱼分类准确率为93.50%和94.90%，高于鲜鱼分类。我们还在两个类别中看到FPR和FNR，并且感染的这里，FPR和FNR的低百分比是指我们的模型不是欠拟合或过拟合。因此，作为一个单独的类预测，受感染的鱼类表现令人满意。我们将两个混淆矩阵表示为热图，以便更好地进行图形表示，如图7所示，无论是否有增强。这个热图可以方便地显示我们的二进制类的分类和错误分类从这个混乱-F1分数¼精确度和召回率图中的矩阵 7（a）我们看到新鲜鱼类被错误分类只有两次与受感染的鱼，和受感染的鱼是misclassi-我们不能仅仅依靠F1分数和准确性的性能评估指标。一个非常高的临界值会夸大模型的准确性。因此，我们还测量FPR（假阳性率），FNR用新鲜的鱼煎一次。图7（b）示出了七条鲜鱼与感染的鱼以及六条感染的鱼与鲜鱼的错误分类。¼Md Shoaib Ahmed、Tanjim Taharat Aurpa和Md. 阿布·卡拉姆·阿扎德沙特国王大学学报5178见图6。图像处理的各种表现形式（展示了特征提取之前的四个图像处理阶段）。表3SVM的类分类结果（无增强）。分类器类准确度（%）精密度（%）召回率/灵敏度（%）特异性（%）F1评分（%）假阳性率（%）假阴性率（%）SVM鲜鱼92.092.7598.4650.095.5250.01.54感染的鱼93.5094.0198.1375.096.0225.01.875表4SVM的类分类结果（具有增强）。分类器类准确度（%）精密度（%）召回率/灵敏度（%）特异性（%）F1评分（%）假阳性率（%）假阴性率（%）SVM鲜鱼93.7596.2396.2381.8296.2318.193.77感染的鱼94.9098.5295.6888.8997.0811.114.31我们在表5中说明了我们提出的分类器SVM从表中可以看出，在没有增强的情况下，准确率为91.42%。此外，94.12%的扩增，这是可靠的检测感染鱼。在图8中，我们展示了ROC曲线，该曲线表明结果反映了有增强和无增强的SVM的综合分类性能。它检查真阳性率（TPR）和假阳性率（FPR）之间的比例。图8（a）显示总体微平均AUC评分为96.20%在未加强的情况下，宏观平均AUC评分为95.93%。与图 8显示（b）微平均AUC评分为98.12%，宏观平均AUC评分为96.71%，增加。在本文中，我们已经分析了SVM到目前为止，但我们同样研究了其他三个分类器的性能评估。我们研究的三个分类器是决策树，逻辑回归和朴素贝叶斯。在图9中，我们绘制了一个条形图，表示我们调查的所有四个分类器的评估指标。在这里，SVMMd Shoaib Ahmed、Tanjim Taharat Aurpa和Md. 阿布·卡拉姆·阿扎德沙特国王大学学报5179见图7。 SVM分类器的混淆矩阵。表5SVM分类器的度量评估。价值（%）无扩增使用增强精度91.4294.12精度86.6789.06回忆或敏感性92.8690.48特异性90.4895.57F1得分89.6689.76假阳性率4.439.52假阴性率9.527.14比其他三个分类器更重要。决策树比逻辑回归更可靠，准确率为81.54%，而逻辑回归的准确率为80.0%，优于朴素贝叶斯。决策树的其余度量精度、灵敏度、特异性和F1得分分别为84.84%、80.0%、83.33%和82.35%，低于高于逻辑回归和朴素贝叶斯的SVM最后，我们看到我们的SVM分类器的预测结果，见图10。在这里，我们展示了我们的二进制类预测新鲜的鱼和受感染的鱼。分类器正确预测插入的原始图像。5.2. 比较分析关于机器学习机制中鱼病检测技术的研究工作没有达到标准。与果树病害、农作物病害等相关检测工作相比，相关工作相对较少。为了评估我们提出的SVM在表6中，我们列出了一些与识别鱼病有关的研究一些工作只集中在图像处理，以识别鱼病，和一些集中在基于机器学习的分类模型。Malik等人（2017）使用k均值分割算法对其工作进行仲裁，并将特征集大小定为2，然后应用神经网络分类器以达到86%的准确度。Lyubchenko et al.（2016）结合k均值聚类和数学形态学对这项工作进行了分割。这项工作采用了图像处理中的三个特征集，并且没有应用任何分类器。因此，准确度不适用。 Malik等人（2017）提出了一些边缘检测方法和形态学操作作为分割过程。这项工作采取了三个特征集，并应用多种分类模型来比较结果。神经网络和K-NN（Nearest Neighborhood）是两种应用模型，准确率分别为86.0%和63.32%见图8。 SVM分类器的ROC曲线。Md Shoaib Ahmed、Tanjim Taharat Aurpa和Md. 阿布·卡拉姆·阿扎德沙特国王大学学报5180见图9。分类器评估指标与图像增强的比较（SVM、决策树、逻辑回归和朴素贝叶斯的准确性、精确度、灵敏度、特异性和F1分数的值）。见图10。基于SVM的鱼类预测。表6本作品与相关作品的比较分析。工作分割算法功能集大小执行的分类分类器准确度（%）这项工作（增加）k-means聚类10是的SVM94.12本作品（不加增）- -91.42Malik等人k-means clustering2是Neural network86.0Lyubchenko等人（2016年）k-means聚类与数学形态学3否不适用不适用Malik等人（2017）边缘检测和形态学运算3是神经网络和K-NN（最近的邻居）86.0（NN）和63.32（K-NN）Md Shoaib Ahmed、Tanjim Taharat Aurpa和Md. 阿布·卡拉姆·阿扎德沙特国王大学学报51816. 讨论鲑鱼疾病检测是自动化研究领域中最需要关注的一个重要研究领域然而，在现代，很少有任何智能解决方案出现在这个领域没有现有的数据集可用于本研究目的。在这项工作中，我们揭示了一个新的数据集鲑鱼疾病检测和进行我们的研究。表1和表4提供了有关我们数据集的信息，我们将其划分为本研究中的实验图 5是我们数据集的一小部分，其中我们介绍了来自我们数据集的新鲜和受感染鱼类的图像。它主要是对输入图像进行定义，并将其处理后与我们的分类器相匹配。我们在这项研究中追求的主要目标是对感染的鲑鱼和新鲜鲑鱼进行分类。我们基于真实世界的图像数据集进行这个实验，以产生一个可靠的系统。为了保证高精度，我们选择了一种非常有效的机器学习算法，称为支持向量机。支持向量机被认为是用于分类目的的主要监督学习算法之一在这项工作中，我们证明选择SVM分类器通过比较我们的结果与其他算法。图来自Fig. 9证明了我们选择SVM分类器而不是其他技术的决定。该分类器优于我们考虑的每一个性能演变指标，以指示感染和新鲜的鱼与Logistic回归、决策树和朴素贝叶斯相比，SVM的准确性、精确度、灵敏度、特异性和F1评分更高。来自表3和表4的用于我们提出的分类器的这些度量我们应用图像处理技术，如三次样条插值，自适应直方图均衡化，和k均值分割前的分类过程。在图6中，我们可以看到这些技术如何为分类器规范化原始输入图像。图 6(b)示出了图6（a）的调整大小后的输出图像。我们使用三次样条插值后实现了这些调整大小的图像。接下来的6（c）主要展示了自适应直方图均衡化产生的对比度增强图像。这一步使我们的图像数据集更清晰的分类。然后利用k均值聚类分割方法对图像中的感染部位和新鲜部位进行在6（d）中，我们显示了实验中的一些分割图像。我们进行我们的实验，把处理后的图像在建议的SVM分类。我们通过测量不同的进化指标来确定我们的分类器的

下载后可阅读完整内容，剩余1页未读，立即下载