没有合适的资源?快使用搜索试试~ 我知道了~
基于VGG和ResNet网络的迁移学习方法实现眼部黑色素瘤检测
工程科学与技术,国际期刊35(2022)101214全长文章通过VGG和ResNet网络使用迁移学习实现丹尼尔·费尔南多·桑托斯-布斯托斯a,b,阮平明b,赫尔伯特·爱德华多·埃斯皮蒂亚a,哥伦比亚波哥大弗朗西斯科·何塞·德卡尔达斯地区大学b法国南特布列塔尼-卢瓦尔河地区国家矿业-大西洋电信高等学校A R T I C L EIN F O文章历史:2021年7月14日收到2022年5月22日修订2022年6月28日接受2022年7月22日在线发售关键词:计算机视觉卷积神经网络医学图像分析葡萄膜黑色素瘤A B S T R A C T由于计算和存储的不断进步,像疾病诊断或语义分割这样的复杂任务现在越来越容易处理。本研究提供了一种使用卷积神经网络(CNN)检测眼异常的探索性方法,并以葡萄膜黑色素瘤(UM)(一种眼癌)为例。在以前的研究中,UM已经使用不同的计算技术进行了研究,这些技术专注于使用模糊系统、神经网络和自适应神经模糊系统的辨别特征。然而,考虑到这个问题的不可继承性,我们决定使用带有迁移学习的神经网络作为一种有希望的替代方案,以提高结果的准确性。就主要贡献而言,结果优于用于检测UM的各种最先进的计算算法,特别是在灵敏度、准确度和准确度方面的改进,分别达到99%、98%和99%。为了减少数据集的偏差,实现了两种算法:使用Gabor滤波器的数据增强算法和使用©2022卡拉布克大学。Elsevier B.V.的出版服务这是CC下的BY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 简介许多癌症患者在常规医疗预约期间或通过症状诊断。例如,乳腺癌,女性中最常见的类型之一[1],以及虹膜、纤毛体或脉络膜的黑色素细胞中发生的新发眼内黑色素瘤(UM),这是成人中常见的恶性肿瘤[2,3]。有证据表明,与较大肿瘤相比,较小肿瘤的生存期更长[4];因此,早期诊断和局部治疗对于肿瘤向癌前生长至关重要。格雷斯。对于UM,估计约50%的患者将发生转移,自诊断之日起存活6-根据[3],大约40%的UM患有转移性疾病,其中肝脏是受影响最严重的,由于肝脏转移特别难治,因此导致高死亡率[6]。当癌症局限于眼睛时,5年相对生存率高约80%。这部分是由于已经开发了大多数治疗非转移性葡萄膜黑色素瘤的方法[6]。对于患有眼黑色素瘤的个体*通讯作者。电 子 邮 件 地 址 : dfsantosb@correo.udistrital.edu.co ( D.F. Santos-Bustos ) ,binh-minh. imt-atlantique.net ( B.M. Nguyen ) , heespitiac@udistrital.edu.co(H.E.间谍)。扩散到身体的远端部位,5年相对存活率约为15%[7]。近年来,计算算法在医学中的应用电 影 已 经 改 变 和 改 造 了 疾 病 诊 断 的 方 式 , 使 计 算 机 辅 助 检 测(CAD)的发展能够提高疾病检测;因此,这些算法被作为预防的工具。这种预防以及早期发现和治疗对于提高癌症控制率至关重要[9,10]。作为[11]中的一个例子,介绍了通过深度学习框架提供辅助临床诊断服务的系统的开发。在这方面,早期发现慢性疾病变得重要,因为这种疾病限制了日常生活活动。例如,[12]说明了深度学习模型如何用于检测慢性肾脏病和2型糖尿病等疾病;此外,这种学习方案可用于识别其他疾病。此外,已经进行了大量的研究,以根据用户的帖子信息检测用户的精神与眼睛聚焦相关的工作是检查虹膜的模式、颜色和其他特征,以确定不同的因素,如患者的例如,在[19]中,a方法显示使用Gabor过滤器检测虹膜疾病https://doi.org/10.1016/j.jestch.2022.1012142215-0986/©2022卡拉布克大学。爱思唯尔B.V.出版服务这是一篇根据CC BY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)开放获取的文章。ScienceDirect上提供的内容列表工程科学与技术,国际期刊日记帐主页:www.elsevier.com/locate/jestch丹尼尔·费尔南多·桑托斯-布斯托斯、阮平明和赫尔伯特·爱德华多·埃斯皮西亚工程科学与技术,国际期刊35(2022)1012142允许诊断角膜水肿、虹膜切开术和结膜炎。另一方面,针对深度学习健康应用,在[20]中分析了不同的模型,以区分COVID-19与X射线图像中的其他胸部相关感染。考虑的一些架构包 括 AlexNet 、 GoogleNet 、 SqueezeNet 、 DenseNet201 、MobileNetV2和InceptionV3,它们使用不同的配置和训练方法。关于用于癌症检测的转移学习,在[23]中提出了一种基于CNN的转移学习方法,该方法具有用于改善乳腺癌分类的结构化过滤器修剪方法,此外,该策略旨在减少训练深度学习模块的运行时间。另一篇需要考虑的文章是[24],其中对人工神经网络、多层感知神经网络和卷积神经网络进行了综述,以检测乳腺恶性肿瘤--重点关注乳腺癌的早期诊断,在这项工作中,它考虑了识别乳腺癌诊断的适当方法的准确性指标。1.1. 提案方法和文件组织虽然UM是一种相对罕见的疾病,但它也是成人中最常见的原发性眼内肿瘤[25]。为了解决这个问题,本文提出了卷积神经网络(CNN)在UM诊断和识别中的不同作用。最重要的是,它还与以前实现的技术,如 模 糊 系 统 ( FS ) , 神 经 网 络 ( NN ) 和 自 适 应 神 经 模 糊 系 统(ANFIS)进行了比较。按此顺序,1描述了本工作中涉及的主要方面本文是使用人工智能(AI)技术诊断UM的先前(已发表)工作的扩展此扩展版本的主要贡献如下所示:据了解,使用CNN进行迁移学习和增加数据以检测UM的研究结果在所考虑的所有性能指标上都优于先前的工作。介绍了一种基于纹理内核特定应用的数据增强技术,以提高性能并减少广义误差。据了解,用Navier-Stoke去除眼睛中光点的算法的实现一个比较框架与以前实现的技术,如FS,NN和ANFIS。在使用像本文这样的计算技术时,需要记住的一个值得注意的方面是"无自由午餐定理",该定理指出,考虑到所有可能的问题集,每种计算技术在任何时代都将表现得像任何其他技术一样好换句话说,没有一种技术能以最佳性能解决所有问题。特别地,对于该问题,并不期望所开发的算法将实现高可解释性或能够检测眼睛中的所有类型的不规则性;相反,本研究的目的是在检测眼睛中的异常癌症样特征方面获得高成功率。本文组织如下。在2中,简要提到了以前用于处理UM的方法。所使用的图像处理和数据增强技术显示在3中,其中4包含所使用的架构。5显示了基于统计检验的初步数据分析。6描述合并的数据集和实验结果。然后在7中进行讨论,然后在8中得出结论。2. 背景人工智能技术在实例、运动跟踪[27]、疾病诊断[28]和图像分割[29]等方面有着广泛的应用;这些技术利用并扩展了传统的疾病诊断。作为一个例子,在[30]中提出了一种通过放射治疗诊断疾病的方法,该算法使用机器学习和特异性特征来区分闭眼和睁开眼;这些工作的替代方案包括使用颗粒的先进技术,例如[2]使用操纵的纳米颗粒来识别癌症部位。本文比较了[31,32]中关于综合虹膜分割相关算法和使用模糊逻辑、神经网络和自适应提出算法的方法的工作。神经模糊网络(ANFIS);在模糊逻辑系统中获得76%的正确分类,在神经网络系统中获得96.04%的正确分类,在ANFIS中获得91.68%的正确分类这些分类器的输入是一个数据集,其中的列是胡的七个时刻h0;h1;h2;h3;h4;h5;h6,以及"健康"和"一-"类图1. 案例研究的视觉摘要:I.样本数据输入(虹膜图像);建议的配置,a)有噪声b)异常发生器c)无光点);具有迁移学习的CNN,IV.比较技术和V.系统检测。●●●●●●●●丹尼尔·费尔南多·桑托斯-布斯托斯、阮平明和赫尔伯特·爱德华多·埃斯皮西亚工程科学与技术,国际期刊35(2022)10121432!是的ð Þ ðÞ这些方法被认为具有以下缺陷1. 当图像从极坐标变换为笛卡尔坐标时,插值会丢失信息并给测量结果增加污点。2. 考虑了训练数据集中类元素数量之间的不平衡,以及疾病的低患病率,这增加了广义误差。3. 以前的模型只使用七个Hu时刻进行训练,这是合适的,因为这些时刻是强有力的描述符;然而,其他特征可能会影响这种疾病的检测。由于上述原因,决定简单地建立一种新的模型配置,使用CNN解决这些问题。然而,从这种特殊的疾病中收集数据来有效地训练CNN是很困难的。因此,选择数据增强技术来生成输入数据,从而减少对训练数据的依赖并减少广义误差(作为正则化方法操作)。例如,将噪声应用为数据增强技术涉及改变图像的一些像素,同时将实际意义保持为整体。例如,在[29]中,作者使用不同的训练集大小训练U型网,并使用不同的人工数据增强策略,如水平翻转、仿射变换、高斯随机场、高斯白噪声、旋转和膨胀,其中当执行水平翻转时,准确性显著提高。同时,在[34]中,对于语音命令识别中的应用,当原始数据集与涉及速度干扰和房间脉冲响应混响的增强方法相结合时,误差率降低,从而提高了用于语音命令识别时卷积神经网络的一般化能力房间脉冲响应混响产生由反射声路引起的语音命令变化,而速度干扰产生由短或长持续时间引起的语音命令变化。在[35]中,它被设计成一个13层CNN,使用三种类型的数据增强方法:Gamma校正、噪声注入和图像旋转,这些方法用于基于图像的水果分类;结果表明,数据增强可以提高总体准确性。最后,在[36]中,显示了用于可解释诊断的随机拼接神经网络(PSSPNN),该模型用于COVID-19、健康受试者、继发性肺结核和社区获得性肺炎的分类。在此应用程序中,改进的多路数据增强有助于避免过拟合。考虑到这一点,提出了一个简单可行的算法-作为一种增强技术,通过使用Gabor滤波器的特定应用来代替纹理识别来创建眼睛异常,这对于当前情况是合适的。值得注意的是,当在图像处理应用中用作预处理器和特征提取器时,例如模式匹配和运动分析或立体镜,这些填充器是最有效的。3. 数据增强和图像处理在本研究中,虹膜是将被分割以执行分类的感兴趣区域(ROI)。CAD中的分割是至关重要的,因为不正确的分割可能导致假阳性(FP)和假阴性(FN),因此,数据库是至关重要的,尤其是当样本不平衡时。本节首先介绍数据增加的背景和所提出的方法采用了这些技术。随后,还显示了执行数据集平衡的算法。3.1. 数据增强数据增强技术(AT)为机器学习模型生成输入数据,以提高性能,减少对训练数据的依赖和过拟合[33,39]。因此,由于UM的发生罕见,因此建议使用AT。特别地,通用输入变换对于该任务是有用的,因为CNN可以鲁棒地分类对象,即使它们被定位在不同的方向上,因为它们对于平移、视点、大小和照明(或这些的组合)、更大、旋转是不变的。AT对于虹膜数据集具有潜在的有用性,因为虹膜可以被视为圆圈。根据[40],数据增强技术被认为是最受欢迎的:翻转:图像可以水平翻转,也可以垂直翻转。例如,不可能垂直翻转汽车的图像,因为它变成了不同的对象(例如,一辆水平翻转的汽车静止不动,但一辆"3"翻转的汽车会不再是一个数字)。缩放:此技术可创建具有不同缩放视图的图像的新版本。结果图像根据预定义的范围放大或缩小。在[41]中,范围可以由一个值或两个阈值值的列表来指定(例如,场景中的对象可以缩放到更大的细节,同时丢失更多的细节)。旋转:以预定义或随机角度旋转图像每个旋转图像在数据集中都是唯一通常,有359度的旋转(例如,通过将书旋转2度仍然可以读取书中的字符噪声添加:应用噪声涉及改变图像的一些像素,同时保持图像作为整体的实际含义(例如,以轻的方式向图像或歌曲添加均匀的白噪声将不影响含义)。通道移位:对于图像的每个通道R;G;B,通道移位将每个通道中的像素值随机移动预定义的范围。因此,通过这种技术产生了多种颜色版本。这种增强技术增加了颜色变化的模型鲁棒性。由于颜色受光的影响,因此当检测系统在不同的光环境(例如,自动驾驶汽车)中使用时,应用该颜色特别有用。为每个数据集定义正确的缩放范围,前提是给定每组图像中感兴趣区域的位置和缩放范围不同。特别地,非常大的缩放值可能会切断感兴趣的区域,而非常小的值可能会由于信息丢失而模糊该区域 在这种情况下,通过实验计算值。可以使用类似的过程来查找旋转和噪声的范围,因为对于每个案例研究,有效的缩放、旋转范围和噪声值是不同的。以正式的方式,给定一个数据集XRn×m,其中n是行数,m是特征数,Y是类(带/带-出UM),因此分类器f:XY具有性能P f,其不够精确,因此n可以通过使用AT的方式扩展,因此Z²X0;X]其中X0是增强数据,f0:Z!Y导致PΔf0PΔf。相互信息不平等导致I Z;Y 6I X;Y,然而,由于这项研究有助于使用外部方法(如Gabor内核)生成新数据,因此可以说●●●●●●●●●●丹尼尔·费尔南多·桑托斯-布斯托斯、阮平明和赫尔伯特·爱德华多·埃斯皮西亚工程科学与技术,国际期刊35(2022)1012144ð Þ ðÞð Þ ðÞIZ; Y P I X; Y为所用方法提供了理论基础。3.2. Gabor过滤器Gabor滤波器基本上是由频率和方向的正弦复合波调制的高斯函数。它具有在空间和频率域中操作的能力,并且可以在任何数量的维度中使用。Gabor滤波器已被广泛用于图像处理任务,特别是与纹理信息提取相关的任务。此外,在本研究中,该过滤器被用作数据增强方法的基础,该方法包含用于生成肿瘤样纹理的Gabor内核生成器。3描述了使用Gabor滤波器K f;h;r从图像I x;y生成增强图像AΔx; y的过程。 这些内核可用于提取由一组过滤器和不同的频率f和方向h[44,45]。对于二维,Gabor过滤器为:Gcx;y 1Bexpd-w dcosqð1Gsx; yCexpod-wsinðqð2q² 2pfPDEx cosðhsy sinðhð3图3.提出了创建肿瘤样斑点以产生增强数据集的方案。区域。然而,在健康类的一些图像中,虹膜外部的部分可能包含高灰色水平像素。由于健康教室只需要覆盖瞳孔中的光模式,因此需要定位瞳孔所在的区域。Hence,从输入图像中,应用Hough元素乘法后为每二二二dx 是的2R2第四章formed,包含光图案已获得。在等式中。(1)、(2)B和C是归一化因子,f决定纹理中要追求的频率。改变h定义在特定方向上定向的纹理;改变r导致改变被分析图像的区域的大小。在2中,显示了Gabor滤波器轮廓的示例,由等式给出(五)。Gx;ye-x2y2=10cos2px5考虑到上述,在3中提出了创建肿瘤样斑点以增加数据集的方案。3.3. 光反射补偿在数据集中,在瞳孔中观察到一些点光,可能是由捕获照片的设备引起的。特别是在健康类数据集中,由于这可能是一个区别标志,因此有必要删除它们,以最大限度地减少偏倚。以这种方式,提出了一种配置III(见6.5),其算法用于补偿眼睛中的光反射,如4. 此过程分为以下步骤:步骤(a):使用阈值和圆霍夫变换构建遮罩。由于光反射具有很强的灰色值,因此使用阈值来获得所需的值非常简单。图2. 由等式(5)给出的Gabor滤波器的轮廓。步骤(b):图像修复技术,以填补在该地区,使其顺利。所选择的 算 法 是 Navier–Stokes method based on fluid mechanics(Navier–Stokes 使用高阶偏微分方程来模拟不可压缩流体是至关重要的,因此产生等光子(图像中的流体)的连续性,从而导致平滑插值。这里的想法是将图像视为流体,并让该流动填充遮罩中指示的区域的孔。在应用Navier-Stoke修复之前,应用形态扩张操作这个动作的瞄准是为了确保空洞和瞳孔的黑暗部分是直接连接因此,暗像素可以流动并填充孔。4. 卷积神经网络一种特殊类型的深度学习模型,用于处理具有网格模式的数据,[47]设计用于从图像中识别视觉模式,CNN在识别人类不容易获得的抽象模式和特征方面表现出高准确性,[48]这是由于与NN相比参数数量的减少。[49]准确性是基于CNN的分类方法是否优秀的重要指标;网络越深,特征抽象越大。这种类型的网络的一些显著方面是消除了对空间维度中的特征映射的依赖,换句话说,深度学习模型可以独立于对象的位置来检测对象,而深度数据在网络中,更大的方面是这些数据所代表的抽象特征。出于上述原因,并考虑到疾病诊断的当前技术水平,使用了VGG-16[52]和ResNet-18以及预训练的CNN和转移学习。4.1. 迁移学习迁移学习是一种使用模型的技术,该模型在一个任务上进行了训练,然后转移到一个新的相关任务上。对于本工作中考虑的情况,图像分类模型w1/4●●●●丹尼尔·费尔南多·桑托斯-布斯托斯、阮平明和赫尔伯特·爱德华多·埃斯皮西亚工程科学与技术,国际期刊35(2022)1012145×××××图4.提出了补偿光反射的方案,其中(a)表示创建掩模的过程和(b)用于图像修复的支架,其中Tr是阈值操作,T h是霍夫圆变换,T m是元素乘法,并且是膨胀过程。ImageNet(一个包含120万张标记训练图像的大型数据集)上的训练可用于眼部异常的分类和检测。因此,当数据集的大小不允许从头开始训练深度神经网络时,迁移学习是有用的。使用迁移学习,神经网络可以有足够的初始参数,并且只需要很小的修改来适应新的任务。当使用迁移学习时,有两种主要的方法。在第一种情况下,预训练的模型权重被认为是新作业中模型的初始权重,并且这些权重在训练过程中被训练和更新。这种方法被称为精细调整迁移学习。另一方面,在干式方法中,预训练模型仅用于提取增益,这意味着预训练权重在新任务的训练过程中不受影响。在这种方法中,只有一个分类器(通常包含完全连接的层)在预训练模型上训练以提供分类结果。这种方法的名称是特征提取转移学习(FETL)。本文采用了微调传输学习方法,该方法的性能优于特征提取传输学习。当训练数据不足时,转移学习特别有用,如[54,55]中所观察到的,在疾病诊断方面的表现与卫生专家相当,并且可用于UM病例。在TL在疾病诊断研究中的应用中,建议使用网络来识别阿尔茨海默病,特别是VGG(VIN)启发的网络被认为是骨干网络(骨干网络:将图像作为输入并提取特征图的网络此外,注意力机制的使用也得到了解决;注意力是一种提高网络性能的机制--以人眼处理图像的方式启发,其他提高网络性能的方法是深度、宽度和基数。按照这个顺序,作者将卷积块注意力模块集成到VIN主干中。还建议避免18路数据增加,以避免过度拟合。实验结果证明了VGG的有效性和18路数据的增加。4.2. 深度卷积神经网络模型本工作评估了两个众所周知的预训练模型VGG-16和ResNet-18的性能,图中描述了ResNet用于本工作的方案。在两个图中,卷积层参数用以下符号表示:接收场大小、conv、通道数。按此顺序,5介绍了ResNet-18体系结构,其中实体线表示标识的截断,而输入和输出相同。点线表示具有不同维度的输入和输出快捷方式。在这种情况下,有两种选择:速记仍然被认为是身份速记--用额外的零条目填充以增加输入的维度,或者使用11卷积来将输入的维度投影到输出。在第二种选择中,快捷方式被称为投影快捷方式(PS)。VGG网是由牛津大学视觉几何小组和DeepMind提出的卷积神经网络,[58]已广泛应用于许多领域,如[59[64]分别用于地点图像识别、水果检测、甲状腺结节识别和物体跟踪。VGG-16的结构可以在6."Conv 1"层的输入为固定大小的224 224 RGB图像。图像通过卷积层的堆栈,其中滤波器与非常小的接收场一起使用。在一种配置中,它使用作为输入通道的线性变换操作的1 - 1卷积滤波器。卷积步长是1像素;卷积层输入的空间填充是为了在卷积之后保持空间分辨率空间池化是由跟随一些卷积层的五个最大池化层产生的。最大池化在2 2像素窗口上执行,步长为2。三个完全连接的层跟随一个Convo-Lutive层的堆栈,最后一个是最大软层。所有隐藏层都使用非线性校正(ReLU)激活功能。ResNet是一种众所周知的卷积神经网络架构,用于培训数百或数千层,以实现出色的性能。ResNet的最大优势是能够减少消失的梯度问题。在ResNet之前,深度网络很难训练,因为梯度需要向后传播到大量的层。一个深度网络,它使梯度无限小。为了解决这个问题,ResNet提出了使用旁路路径概念的新颖想法,作为一种跳过层之间的反向连接并在梯度路径中创建标识捷径的方法,这允许梯度流更快地到达ResNet也已用于医学图像分类和诊断。在[53],S. Minaee等人使用ResNet-18和ResNet-50结合转移学习从胸部X线图像预测COVID-19。这两个模型都是在ImageNet数据集上预训练的使用ResNet-18的分类结果为89:58%,使用ResNet-50的分类结果为92:29%在另一项研究中,S.Ayyachamy等人[66]将ResNet-18应用于其基于内容的图像检索框架中,以检索与被检查者具有相似病理学的图像。他们的预培训ResNet-18专业版空分类准确率为92%,平均检索精度为0: 9。丹尼尔·费尔南多·桑托斯-布斯托斯、阮平明和赫尔伯特·爱德华多·埃斯皮西亚工程科学与技术,国际期刊35(2022)1012146有缺陷的N1四分之一吨t图5。ResNet-18的网络架构示例,用于UM诊断的病例研究。斑点短发增加了尺寸。Conv块结合卷积、批处理归一化和最大池操作。图6. 用于UM诊断病例研究的VGG-16的示例网络架构Conv块由卷积+批量归一化+最大池操作组成。两个模型都用交叉熵损失函数训练,以最小化预测概率和地面真实概率之间的距离。其定义见等式。(6),带PI 和qi分别为基础真实概率和预测概率RMSProp(根均方传播)优化器,这意味着Adam在稀疏梯度和在线非平稳设置下工作良好。Adam优化器的更新规则描述为:M.1Xht/ht-1-að7þ交叉熵1/ 4-N1/1 pilogqið6t我是四分之一第八章对于更新参数,使用Adam(自适应矩估计)优化器。此优化器利用动量和自适应学习率的优势,通过考虑过去来更快地收敛1-btS.T1-bt第九章梯度和平方梯度。Adam Optimizer结合了AdaGrad(自适应梯度)优化器和AdaGrad(自适应梯度)优化器的优点。1-b1-rtd102-2-2 -2- 1- 1 - 2- 2 -1-1 - 12丹尼尔·费尔南多·桑托斯-布斯托斯、阮平明和赫尔伯特·爱德华多·埃斯皮西亚工程科学与技术,国际期刊35(2022)1012147R在这组方程中,h表示网络的此外,表示梯度运算符,A是学习率,S是平滑项,这防止了分裂由零。超参数b1和b2是瞬时估计的指数衰减率。5. 初步数据分析对于分类过程,检查数据集中类之间的差异尤为重要,这允许分类器学习和区分不同类型的图像,以节省设计和配置培训中的时间和资源。从图中可以清楚地看出,特征组之间存在差异,这是样本中存在这种差异的证据,但在统计学上还不够。因此,有必要建立一个统计检验,为这两个样本来自两个不同的人群提供更强有力的证据。在这个过程中,使用图像的矩,这些矩是用简单或复杂的图形提供对象的一般表示的度量。在这种情况下,在初步分析中使用Hu矩作为测量值。为了进行统计检验,考虑到描述符HIPVALUE 0: 05.<总之,数据集不是来自正态分布;因此,它被使用kal-Wallis检验 ,因为 方差分析 仅在数 据遵循 正态分布 时实施 。Kruskall-Wallis检验是一种非参数为了确定组之间的差异,零假设和备择假设如下:零假设H0:没有UM的图像的Hu值的平均值等于有UM的图像的Hu值。H0:8LIJLI 1备选假设H1:没有UM的图像的平均Hu值与有UM的图像的Hu值不同H1:9LIJLI–携带Kruskal-Wallis测试后,结果显示在最后两列中考虑到I型错误的概率,H0被拒绝,结论是可以在两组特征之间建立差异,因为它们来自不同的群体,因此有可能继续到选择分类器和参数的阶段,并且将定义不同的配置,以便在稍后的阶段可以进行模型的训练和生成。6. 实验结果为了生成结果,使用了Google的Colab,该Colab提供GPU计算和足够的内存来训练分类器。查看数据集,有150张健康图像和33张不健康图像,其中一些显示在7中。设计了两种实验配置(配置I和配置II)来训练VGG-16和ResNet-18,以减少偏倚并增加拟定方法的稳健性。此外,配置III可补偿眼睛中的光反射在这些结果中,在健康类别中的一些图像中,虹膜外的部分可能包含高灰度像素,这是由于拍摄图像的条件;然而,由于条件是在黑暗的环境中,这导致部分(如硬皮)具有灰色色调;幸运的是,这也增加了虹膜的色调。事实上,这不是一个问题,因为它可以被解释为一个技术放大按此顺序,2显示了在此工作中获得的结果以及在使用其他方法的先前实现中呈现的其他结果。在2中,卷积网络的实现在所有性能指标方面都优于先前的工作,表明CNN可能是检测新发黑色素瘤的可行选择。6.1. 参数、指标和测试本研究所处的环境是二元分类问题的机器学习任务。健康个体-这里的als被标记为阳性(无UM),而阴性标签被分配给异常图像(有UM)。从该二进制分类中,获得标签TP;TN;FP和FN,这将便于计算以下度量:准确性(模型正确的频率),错误率(模型错误的频率),敏感性(模型如何正确分类阳性实例)、特异性(模型如何对阴性实例进行分类),精度(模型在检测到阳性时如何正确分类),F评分(准确度和灵敏度之间的协调平均值)和Jaccard相似性系数(JSC),对应于预测值和灵敏度之间的相似性表1使用和不使用UM的类的Shapiro-Wilk和D 'Agostino-Pearson检验结果以及Kruskal-Wallis检验结果的正态性检验没有UM有UM变量统计学PVAL统计学PVAL统计学PVAL统计学PVAL统计学PVALh10.772.86e-16110.381.07e-240.6301312.818.42e-286100.731.05e-23h20.491.42e-24256.971.58e-560.3101922.19083.526.29e-20h30.463.82e-24179.938.46e-400.1202545.110107.014.43e-25h40.441.58e-24192.421.67e-420.1202545.23075.573.53e-18h50.236.49e-28319.404.39e-700.0403131.43056.545.49e-14H60.272.22e-27303.131.49e-660.0802612.77047.545.39e-12h70.214.04e-28258.069.17e-570.160655.275.11e-1434.620.031丹尼尔·费尔南多·桑托斯-布斯托斯、阮平明和赫尔伯特·爱德华多·埃斯皮西亚工程科学与技术,国际期刊35(2022)1012148×× ×四分之一þ四分之一ω得分四分之一-四分之一和图7. 数据集中的一些图像,其中½1:0:]表示该图像属于一级健康,½0:1:]属于二级不健康。在实际类中,该系数与F分数呈线性相关;下面显示方程。将对VGG-16的神经网络行为进行建模的超参数如下:批处理大小为128,学习速率为0:0001。另一方面,ResNet-18、批处理大小和学习速率分别设置为20和0: 0003。所有输入图像都被重新缩放为224 224 3,以满足网络的输入要求6.2. 数据集原始数据库取自[73]。在增强过程之后,获得了2048个图像的数据集,其中1024个是健康的,1024个是不健康的。使用500张图像的数据集进行测试,并在7中显示了一些结果6.3. 配置I对于此数据集配置,ResNet-18和VGG的测试准确率分别为98%和97:6%然而,这种高准确度被认为不是由于肿瘤,而是由于其他分化特征,例如瞳孔中的光图案和虹膜的尺度。准确地说,几乎所有健康教室的图像都包含瞳孔中的一点反射光,这是一个有偏见的数据集,这些网络主要基于这种噪声进行训练。混淆矩阵在8和9中显示。此外,指标显示在2.尽管CNN的业绩受到了特异性TNFPTN14岁在许多图像中,它被创造了一种新的方式来创造上面描述的异常事物。另一方面,这可能导致新的敏感性T PRAL网络将专注于学习这种人工创建的15TPFN和准确性TP16TPFPF2精密×灵敏度Vity17准确性敏感性vity肿瘤的模式预期与不健康图像中显示的肿瘤相似。然而,通过使用该系统,将识别异常(即使是人工产生的),这不是一个主要问题,因为在检测到异常后,医生(医学)分配了额外的研究来验证CAD结果。JSCTPTPFN FP18岁6.4. 配置II此外,当二进制分类超过准确度和F评分时,也会计算度量马修斯相关系数(MCC),这是一个值得信赖的指标,因为当一个标签的性能比另一个标签好得多时,准确度可能会出现误导结果。[72]与其他指标不同,这意味着安全范围1(最差)比1(最好),MCC的方程为如以下所示。TP·TN-FP·FN本节显示了使用具有人工纹理样异常的增强数据集的结果,其中一些异常可以在10中看到。分类器分别用1024和250张图像进行了进一步的训练和测试,其中一半的时间是用模拟异常生成的图像进行的,以减少由光照和亮度引起的偏差;该数据集的样本可以在MCC四分之一他是一个很好的例子,他是一个很好的例子。19岁11.经过培训和测试,VGG-16和ResNet-18型号表2分类技术的比较结果UM。方法准确性精确度灵敏度错误率F1评分MCCJSC[31]第32话0.76630.83920.88850.23370.8614-0.7565[31]第三十一话0.9604--0.0396---[31]第三十一话0.9569--0.0431---[31]第三十一话0.9554--0.0446---神经模糊构型I[32]0.90200.76710.28280.09800.41330.41170.2605神经模糊构型II[32]0.89580.76710.48480.10420.59420.47670.4227神经模糊构型III[32]0.91680.73680.49490.08320.59210.56150.4206VGG-16配置I0.97600.95200.99170.02400.97140.94480.9444ResNet-18配置I0.98000.96001.00.02000.97960.96080.9600VGG-16 II构型0.96200.96800.95650.03800.96240.92410.9275ResNet-18配置II0.96400.94400.98330.03600.96320.92870.9290VGG-16配置III0.99000.98400.98800.00100.98600.97200.9724ResNet-18配置III0.96800.98000.95700.03200.96940.93630.9406提供具有96%测试准确度的相关结果在12和13它丹尼尔·费尔南多·桑托斯-布斯托斯、阮平明和赫尔伯特·爱德华多·埃斯皮西亚工程科学与技术,国际期刊35(2022)1012149图8. 矩阵混淆ResNet-18图11.处理后带有图像的不健康数据集,以添加圆形异常,其中½1:0:]表示图像属于一级(健康),½0:1:]表示图像属于二级不健康。图9. 混乱矩阵VGG-16图10。 添加肿瘤样异常后的健康图像。图12。 混淆矩阵ResNet-18可以查看配置II的结果,指标显示在2中。6.5. 配置III在本部分中,使用数据集对模型进行训练和测试,其中光反射在健康和不健康类别中得到补偿分类器仍在使用1024和250个图像对每个类进行训练和测试。数据集的排列与配置I相同(这意味着没有像配置II那样的不健康类混合)。经过训练和测试,VGG-16和ResNet-18模型分别提供了99%和97%的显著结果,并在14和15中测试了准确性。图13. VGG-16的混淆矩阵图14. 混淆矩阵ResNet-18丹尼尔·费尔南多·桑托斯-布斯托斯、阮平明和赫尔伯特·爱德华多·埃斯皮西亚工程科学与技术,国际期刊35(2022)10121410X1/2/2/2/-真实预测X11真预测图15. VGG-16的混乱矩阵当结果显示在混杂矩阵中时,在光反射补偿之后,数据集变成无偏。特别是对于VGG-16,分类器提供了极好的结果。6.6. 葡萄膜黑色素瘤的检测在产生用于诊断新发黑色素瘤的分类器之后,训练物体检测系统以识别异常定位的区域。然后,使用预训练的ResNet-18模型,并在其顶部放置一个具有4个神经元的完全连接的层,该层输出表示定义矩形框的两个点的二维坐标:左上点和右下点。使用900个图像的数据集(用边界框标记)训练网络,训练和测试比率分别为0: 8和0: 2。在训练过程中,应用L1损失函数来测量模型的改进,并应用Adam优化器来更新参数。L1损失函数定义如下。其中YTrue和YPredict分别是地面真坐标和预测坐标。方程中的均方误差(SSE)。(20)也在进行训练过程时进行了研究,然而,结果与使用由等式给出的L1 损 失 的 模 型没有显著差异。(21)。NSSE Y Y YI20Ni1/4NL损失YiYi21N1/1卷积神经网络使用100时间段,学习速率为0: 008,批处理大小为20。列车运行和验证损失在16中显示。如所观察到的,在最后阶段,验证损失低于训练损失。图16.培训过程中的培训损失和验证损失。图17。使用ResNet-18在使用Gabor过滤器生成的异常数据集上检测异常。图18。 使用卷积神经网络ResNet-18检测葡萄膜黑色素瘤。图19. 使用ResNet-18和虹膜上无光斑的数据集检测到葡萄膜黑色素瘤。在执行此过程之后,由开发的系统生成的一些输出显示在下面,其中红色矩形与系统检测到的异常相对应。17显示了使用Gabor滤波器生成的异常,以及使用ResNet-18的检测。以这种方式,在18中显示了用ResNet-18检测到的新发黑色素瘤的示例。与此同时,19显示了使用ResNet-18检测到的新发黑色素瘤的结果,其中虹膜上没有亮点的数据集使用了4个过程。7. 讨论在目前的研究中,使用了两种卷积神经网络架构,根据结果,观察到在这种情况下,越深越好,因为VGG16模型的性能优于Resnet18,而且需要更多的时间来训练。另一方面,重要的是要考虑健康图像的过拟合效应;为了克服这个问题,已经提出了使用Gabor滤波器的不同的数据增强技术,以创建类似于眼异常的纹理,这导致了广义误差的减少,使该增强技术适用于相关工作。通过重整方法评估拟定的CNN模型,特别是通过k倍交叉验证,从中计算指标的平均得分并在每个训练期内直接进行比较;因此,由于训练纪元数导致的概率降低了统计簇的可能性,因此未对结果应用额外的统计方法。然而,这种可能性并没有被忽视,它被预测为未来的工作,以简单的统计显著性检验。此外,需要考虑的一个方面是将可解释性集成到CNN设计中以实现更好的配置的可能性。丹尼尔·费尔南多·桑托斯-布斯托斯、阮平明和赫尔伯特·爱德华多·埃斯皮西亚工程科学与技术,国际期刊35(2022)10121411CNN的报道这可以通过将数字信号处理的概念和运算符结合到Convolutionary层的设计如结果所示,AT的使用是该应用的一个合适的选择,为了改善结果,它可以使用Goodfel-low[74]提出的生成对抗网络(GAN)技术,该方法是创建生成网络模型,该生成网络模型可以生成真实数据,在这种情况下,生成肿瘤图像或任何其他种类的眼睛异常。最后,所使用的框架可能受到可用数据数量少
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 平尾装配工作平台运输支撑系统设计与应用
- MAX-MIN Ant System:用MATLAB解决旅行商问题
- Flutter状态管理新秀:sealed_flutter_bloc包整合seal_unions
- Pong²开源游戏:双人对战图形化的经典竞技体验
- jQuery spriteAnimator插件:创建精灵动画的利器
- 广播媒体对象传输方法与设备的技术分析
- MATLAB HDF5数据提取工具:深层结构化数据处理
- 适用于arm64的Valgrind交叉编译包发布
- 基于canvas和Java后端的小程序“飞翔的小鸟”完整示例
- 全面升级STM32F7 Discovery LCD BSP驱动程序
- React Router v4 入门教程与示例代码解析
- 下载OpenCV各版本安装包,全面覆盖2.4至4.5
- 手写笔画分割技术的新突破:智能分割方法与装置
- 基于Koplowitz & Bruckstein算法的MATLAB周长估计方法
- Modbus4j-3.0.3版本免费下载指南
- PoqetPresenter:Sharp Zaurus上的开源OpenOffice演示查看器
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功