基于FCN-ResAlexNet的皮肤病变自动分割系统

7 浏览量更新于2024-01-07 收藏 2.07MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

工程科学与技术，国际期刊34（2022）101174一个基于FCN-ResAlexNet的皮肤病变自动分割系统Sezin Barına，Gür Emre Güraksınb，a土耳其Afyon Kocatepe大学生物医学工程系b土耳其Afyon Kocatepe大学计算机工程系阿提奇莱因福奥文章历史记录：2021年7月8日收到2022年4月12日修订2022年5月5日接受2022年5月20日网上发售保留字：皮肤病变分割卷积神经网络深度学习迁移学习A B S T R A C T皮肤癌是一个严重的全球健康问题，具有高发病率和死亡率。因此，计算机辅助自动诊断系统是必不可少的，以成功地诊断皮肤病变。实现这一目标的最重要的方法之一本研究比较了用于通过深度卷积神经网络（CNN）架构提高皮肤图像中病变分割性能的不同标准。此外，针对皮肤病变的分割，提出了一种新的基于混合FCN（Fully Convolutional Network）的深度学习架构，其中编码器结构采用AlexNet和ResNet18深度学习架构，解码器部分包含三个反卷积层。在这项研究中，使用了最常用于皮肤病变分割的ISIC 2017和ISIC 2018数据集。结果表明，使用ISIC 2017数据集训练的拟议架构FCN-ResAlexNet在准确性、骰子和Jaccard指数性能指标方面分别比 FCN-AlexNet架构高出0.35% 、 2.73% 和4.2% 此外，使用 ISIC 2018数据集训练的FCN-ResAlexNet架构在准确性，骰子和Jaccard索引性能指标方面分别比FCN-AlexNet架构高出1.79%，0.95%和1.5%。©2022 Karabuk University. Elsevier B.V.的出版服务。这是CCBY-NC-ND许可证（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍有两种类型的皮肤癌：黑素瘤（恶性）和非黑素瘤（非恶性）。非黑色素瘤皮肤癌在大多数国家报告不足[1]。然而，国际癌症研究机构（IARC）发布的GLOBOCAN在线数据库报告了287，700例新发黑色素瘤病例和1，042，100例新发非黑色素瘤病例，2018年分别导致60，700例和65，200例死亡[2]。在过去的十年中，黑色素瘤皮肤癌（MSC）的死亡人数每年增加约50%[3]。这表明皮肤癌正在成为一个日益重要的公共卫生问题。当早期诊断时，MSC具有高恢复率[3]。然而，MSC图像上病变与非病变区域之间的对比度较低。因此，需要专业知识来区分这两个领域来诊断MSC，主要导致皮肤科医生之间的意见分歧。自动分析人体皮肤具有挑战性，因为它在粗糙度，色调，毛发*通讯作者。电子邮件地址： sbarin@aku.edu.tr （ S.Barın ）， emreguraksin@aku.edu.tr（G.E.Güraksın）。由Karabuk大学负责进行同行审查质量等，这取决于地理和生活条件、气候和遗传因素[4]。因此，皮肤科医生需要成功的自动分析系统来做出快速准确的这一主张得到了Ferrante di Ruffano L等人的证实[5]他们断言自动诊断系统是高度敏感的系统，对专家诊断很有用。皮肤病变在形态学上是相似的，这显著地影响了自动分类方法（ACM）的成功虽然ACM擅长诊断皮肤病变，但它们没有达到我们的期望。自动皮肤病变分析通常包括四个阶段：预处理，分割，特征提取和分类[6]。分类的成功在很大程度上取决于前几个阶段的结果[7]。该研究给出了分割的建议分割是从非病变区域中提取病变区域的过程[8]。皮肤病变分割是计算机辅助诊断系统和图像引导手术方法成功的重要步骤。在成功的分割过程中，非病变区域被移除。通过这种方式，由于只有具有皮肤病变的区域的图像可以用于深度学习方法的分类，因此表示所提取的特征所属的类别的能力将是https://doi.org/10.1016/j.jestch.2022.1011742215-0986/©2022 Karabuk University.出版社：Elsevier B.V.这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表工程科学与技术国际期刊杂志主页：www.elsevier.com/locate/jestchS.巴林和古尔·埃姆雷·古拉克森工程科学与技术，国际期刊34（2022）1011742最佳[9]。此外，皮肤镜图像中的背景大多具有噪声;因此，学习与背景对应的像素中的全局上下文可能导致模型错误分类[10]。成功的分割将增加分类步骤中所需的特征和疾病的背景[9]。通过这种方式，由于训练时间的减少，计算成本将降低，并且由于具有更鲁棒的上下文的特征，自动诊断的准确性将提高。研究人员提出了许多传统的图像分割方法，采用不同的算法方法，但最佳性能仍然很不理想。因此，有大量的研究对皮肤病变分割，但它仍然是一个未知的领域，皮肤图像和病变的形态和物理特征使分割成为一个具有挑战性的过程[11，12]。换句话说，有大量关于皮肤病变分割的研究，但鉴于皮肤图像和病变的形态和物理特征，这仍然是一个未知的领域，使得分割成为一个具有挑战性的过程[11，12]。Adegun和Viriri[13]研究了四类皮肤病变分割操作：基于阈值和聚类的[14-16]，他们确定了每门课的优点和缺点根据他们的结果，前三种方法有缺点影响分割性能，而最后一个没有缺点影响分割。此外，深度学习方法可以比传统方法更好地分析医学图像分析有许多分析方法然而，近年来已经见证了数据的大小和复杂性的急剧增加以及计算机硬件/软件系统的显著进步这些发展导致了深度学习方法的传播和改进，以高精度和高精度分析医学图像。近年来，机器学习和深度学习方法在皮肤癌分割和分类研究中的使用显著增加Khan等人[19]提出了一种用于多类皮肤癌分类的双流深度神经网络信息融合框架。研究人员已经注意到在使用多类不平衡数据集的皮肤病变分类研究中分割和预处理的不足之处拟议的工作包括两个平行运行的主流。在第一部分中，DenseNet201架构被提供了使用基于融合的对比度增强技术开发的图像。采用偏度控制的蛾焰优化算法对提取的特征进行优化。在另一部分中，使用MobileNetV2深度学习架构提取的特征使用推荐的特征选择框架进行下采样。最后，使用一种新的并行多最大系数相关方法将两个流中的区别特征结合起来。提取的特征用于使用多类极端学习机分类器对皮肤病变图像进行分类。三个不平衡皮肤数据集（HAM10000，ISBI2018和ISIC2019）已被用于测试所提出的方法。Kassem等人。[20]对使用机器学习和深度学习方法进行皮肤病变分类[21该综述和其他文献研究表明，深度学习方法经常用于皮肤病变分割以及分类研究。Zafar等人[26]描述了一种用于分割病变边界的自动化方法，该方法结合了两种架构，即U-Net 和ResNet ，统称为Res-Unet。在训练之前，对图像使用所提出的架构、归一化、去噪、新的毛发去除算法和去噪预处理。使用ISIC 2017[27]进行训练，使用ISIC 2017[27]和PH2[28]数据集进行测试。所提出的方法实现了0.772的Jaccard指数和DiceISIC 2017测试集的系数为0.858，Jaccard指数PH2数据集的Dice系数为0.854和0.924。Khan等人。[29]提出了一种新的深度学习系统，具有皮肤病变分割和分类步骤的两个基本步骤。基于掩模递归卷积神经网络（MASK R-CNN）的架构用于病变分割，三个数据集（PH 2、ISBI2016和ISIC 2017）已用于验证分割过程。Resnet 50与特征金字塔网络（FPN）相结合，被用作MASK R-CNN设计的骨干。之后，将基于层的全连接特征整合以生成最终的掩模图像。在分类阶段，创建了一个24层卷积神经网络架构，其激活取决于更高特征的显示。最后，softmax分类器被赋予最好的CNN特征进行分类。分类是用HAM10000数据集完成的。Hasan等人。[18]描述了一种名为DSNet的新的自动皮肤病变分割网络，它有121层，在编码器结构中模仿DenseNet架构。该架构使用深度可分离卷积代替标准卷积，将学习到的区分特征投影到不同编码器阶段的像素空间上，并使网络轻量化。使用开源ISIC 2017[17]进行培训，使用ISIC 2017和PH2数据集进行测试。对于ISIC-2017和PH 2 ， DSNet 实现的平均骨折愈合率（ mIoU ）分别为 77.5% 和87.0%。相对于mIoU，该网络的性能分别优于U-Net和FCN 8，分别为3.6%和6.8ISIC-2017数据集。Khan等人[30]专注于独立执行分割和分类步骤以诊断皮肤癌的系统。在分割阶段，提出了一种混合框架，该框架利用具有20层和17层结构的两种CNN架构的互补优势来生成分割图像，并提出了一种结合联合概率分布和边缘分布函数来细化分割图像的图像融合机制。对于分割过程，采用了三个数据集，包括ISBI2016、ISIC 2017和ISIC 2018，而HAM 10000、ISIC 2018和ISIC2019数据集用于分类任务。从建议的混合分割架构实现的准确率分别为92.06%，92.68%和92.7%。当比较混合、17层和20层分割架构的准确度值时，可以看出混合架构提供了大约5%的增加。Goyal等人。[31]专注于使用FCN-AlexNet，FCN-32 s，FCN-16 s和FCN-8 s深度学习架构进行多类皮肤病变分割。虽然在FCN-AlexNet的编码器结构中使用了Alex-Net，但在FCN-32、FCN-16和FCN-8的编码器结构中使用了VGG-16。FCN-8 s/16 s和32 s型号之间的差异在于具有不同像素步幅的上采样层;在FCN-32 s中，上采样是在32像素步幅的帮助下执行的，而16像素步幅用于FCN-16，8像素步幅用于FCN-8。结果表明，FCN-8 s在8步分割中的Dice评分最高，在多分类分割中，痣分类的Dice评分为78.5%，黑色素瘤分类的Dice评分为65.3%，脂溢性角化病分类的Dice评分为55.7%，对黑色素瘤的识别准确率为84.62%。Khan等人[32]提出了一种基于最具判别力的深度特征的完全自动化的多类皮肤病变分割和分类方法。在本研究的分割阶段，在执行名为LCcHIV（局部颜色控制直方图强度值）的新型混合对比度拉伸方法用于皮肤图像增强之后，提出了一种新的基于深度学习的显着性方法，该方法使用自定义10层CNN实现。在ISBI 2016，ISBI 2017，ISIC 2018和PH2数据集上分析了所提出方法的分割性能，分别达到了 95.38% ，95.79%，92.69%和98.70%的Xie等人。[33]使用ISIC 2017进行培训，ISIC 2017，ISIC 2016和PH2[28]S.巴林和古尔·埃姆雷·古拉克森工程科学与技术，国际期刊34（2022）1011743进行测试。他们设计了一种卷积神经网络（CNN）架构，使用三种不同的高分辨率特征块进行皮肤病变分割。他们调整了图像的大小，并通过使用翻转和旋转数据增强技术增加了数据量。他们在ISIC2016、ISIC2017和PH2中获得的Jaccard指数分别为0.783、0.858和0.857本文研究了图像处理方法（用于皮肤图像中的病变分割）、损失函数（用于像素分类层）和优化算法（用于训练深度CNN架构）对深度分割架构性能的影响。主要目标是在不增加计算负载的情况下提高深度CNN分割架构的性能。因此，我们使用FCN-AlexNet架构进行了评估，这是一种简单的架构，需要很少的计算并产生成功的分割结果[34]。我们使用图像去噪、颜色恒常和直方图均衡（HE）算法进行图像处理;交叉熵、加权交叉熵和Tversky函数作为损失函数; ADAM、SGDM和RMSProp算法作为优化算法。在所有基于人工神经网络的系统中表示所提取的特征的数据集的性能对人工神经网络的性能非常出于这个原因，编码器结构的性能，其中特征是从图像中提取的，具有显着的影响，在基于FCN的系统的架构的成功与其他分段结构相比，FCN-AlexNet架构的最大优势是其简单性，因此计算成本低另一方面，他们不能实现更复杂的架构，如UNet的成功。针对FCN-AlexNet的这一优势和不足，设计了基于FCN-AlexNet的深度学习许多这些研究的最大缺点是计算成本的增加根据所有这些信息，在这项研究中，通过将FCN-AlexNet架构的编码器结构与ResNet 18架构相结合，创建了一种混合结构所提出的架构是一个相对更复杂的架构，不需要额外的数学计算。在这项研究中，主要的动机是通过保持低的计算成本和从数据集中提取高度本工作的主要贡献如下：1. 提出了一种新的混合ResAlexNet深度神经网络，它是ResNet18和AlexNet皮肤研究人员可以获得图像数据集，并每年举办不同数据集的比赛，以促进诊断黑色素瘤和其他皮肤癌的自动计算机辅助方法。 ISIC2017[27]是一个开源数据集，可供研究人员用于分割和分类。它是用于训练深度学习架构的最受欢迎的它由2750张（2000张训练图像、150张验证图像和600张测试图像）和三类皮肤图像组成：黑色素细胞痣、黑色素瘤和脂溢性角化病。为了观察所提出的方法对不同数据集的影响，ISIC 2018：皮肤病变分析对黑色素瘤检测的重大挑战数据集 [27 ， 35] 也用于训练 FCN-AlexNet 和所提出的 FCN-ResAlexNet架构。该数据集由2，594个RGB图像组成，包括七个不同的类别：良性（ B ）、脂溢性角化病（ SK ）、基底细胞癌（BCC）、光化性角化病（AK）、皮肤纤维瘤（DF）、血管病变（VL）和黑色素瘤（M）皮肤病变。由于ISIC 2018数据集的测试图像没有地面真实数据，因此在该数据集的训练中应用了5倍交叉验证图图2示出了样本图像及其地面真值分割图像。2.1. 预处理进行预处理以提高图像质量。早期的研究表明，预处理可以提高分割性能[36因此，我们在图像上应用了不同类型的预处理[消隐、颜色恒定性和对比度受限自适应直方图均衡（CLAHE）]，以确定它们对架构性能的影响。FCN-AlexNet架构输入设置为不同大小（448 x448 x3、224x224 x3、360 x480 x3等）。以评估图像大小对分割结构的影响。图像在被馈送到分割架构之前被调整大小为架构的输入大小。采用CLAHE图像增强算法和基于灰度世界的颜色恒常性图像增强算法对图像进行增强。颜色恒常性是图像特征的关键颜色恒常性用于最小化不同光源对图像的影响。有不同类型的颜色恒定性算法，但灰色世界算法（GWA）[39]是最流行的一种，因为它的计算复杂度低[40]。灰色世界算法是所有颜色通道的平均值除以每个颜色通道的平均值（等式10）。① ①）。图3示出了算法对图像的影响。“I0R;I0G;I0B“。IRω表示IRGBω;。IGω表示IRGB;。IBωmeanIRGB：#病灶分割2. 提出了一个强大的和全自动分割系统，可以分割皮肤病变。平均相对湿度平均IG平均IBð1Þ3. 使用两个不同的数据集与各种预处理方法，优化算法和损失函数，以便系统成功地分割皮肤图像从非病变到病变。2.材料和方法我们基于FCN-AlexNet [34]架构设计了一种新的分割架构，用于皮肤病变的全自动分割。我们还采用了不同的图像预处理方法和损失函数，以提高该架构的性能。该研究有三个阶段：预处理，分割，以及结果的呈现和比较（见图1）。 1为流程图）。ISIC 2017数据集[27]用于训练和测试。这是一个流行的数据集，已被大多数研究使用。国际皮肤成像协作组织（ISIC）使数字皮肤病变直方图是一种显示分布的统计方法色值。直方图均衡化方法被广泛用于具有不规则颜色分布的图像中，以增强图像对比度，因为它是一种计算量低的简单方法[36]。CLAHE将图像分解成块并设置阈值，然后确定与该阈值对应的直方图的数量。然后，它将这些块连接在一起以创建直方图均衡图像。我们还将CLAHE应用于图像的每个颜色通道，并研究了皮肤病变对分割的影响。图图4示出了CLAHE对图像的影响和直方图中的变化。2.2. 分割分割阶段涉及提取图像中的皮肤病变。这一阶段的目的是防止其他非病变结构影响诊断程序，并作出准确的S.巴林和古尔·埃姆雷·古拉克森工程科学与技术，国际期刊34（2022）1011744Fig. 1. 研究流程图图二. ISIC2017和ISIC2018数据集的一些示例图像。图三. ISIC2017原始和GWA后图像。诊断. AlexNet深度学习架构具有简单的架构，是医学图像分析中广泛使用的方法，因为与许多transfer学习架构相比，它的计算成本较低，但因为它实现了非常成功的结果[41这项研究采用了不同的程序，基于AlexNet深度学习架构的全卷积神经元（FCN）网络结构，最大限度地提高架构性能。FCN-AlexNet是首选的架构，因为它比其他分割架构更简单，但同样准确。Kaymak等人[44]计算了训练次数，S.巴林和古尔·埃姆雷·古拉克森工程科学与技术，国际期刊34（2022）1011745见图4。原始和CLAHE后图像和直方图。不同的架构（表3）。根据他们的研究结果，由于结构简单，FCN-AlexNet架构将计算成本降低了约80%。考虑到这一优势，我们提出了一种混合方法（FCN-ResAlexNet）来提高FCN-AlexNet架构的性能。FCN-ResAlexNet有两个步骤：（1）通过图像预处理步骤增强图像，（2）将AlexNet架构与ResNet-18架构集成。我们还训练并包含Unet和DeepLabV 3+架构，以将FCN-ResAlexNet与其他成功的基于深度学习的分割架构进行比较。在训练中，我们使用了FCN-AlexNet架构中最成功的图像预处理技术和训练参数。Ronneberger等人[45]是第一个提出并使用U- Net架构来分割生物医学图像的人从那时起，该体系结构已被广泛利用，在许多领域的评估方法U-Net架构基于FCN结构，具有类似U的架构，因此得名。它由两部分组成：编码器和解码器。编码器由类似于VGG[46]深度学习架构的CNN模型组成编码器涉及通过卷积和池化层进行下采样，并创建特征图。解码器涉及通过上卷积层进行上采样，并将图像重置回其原始大小。DeepLabV3 +架构是DeepLabV架构的最新版本，最早由Google研究人员Chen等人提出[47]。DeepLabV3 +架构在分割方面表现非常好。 DeepLabV架构使用atrous卷积层。通常，图像映射会缩小在尺寸上。然而，atrous卷积层可以防止这种减少，而不会增加参数数量和计算成本。此外，由DeepLabV2架构引入的atrous空间金字塔池（ASPP）结构允许网络在多个尺度上进行分割[48]。DeepLabV3架构引入的图像级功能扩展了DeepLabV2 架构中使用的 ASPP模块。DeepLabV3 +架构更新了DeepLabV3架构的解码器模块。FCN-AlexNet最早由Long等人提出[34]。它是一个基于AlexNet的分割架构，AlexNet是一个基于CNN的深度学习架构。与大多数基于CNN的深度学习分割架构一样，它由编码器-解码器结构组成。分割架构的编码器结构由AlexNet深度学习架构组成。Krizhevsky等人[49]设计了具有基于CNN的深度学习架构的AlexNet。他们用1000类ImageNet图像数据集训练了AlexNet。在FCN-AlexNet分段架构的编码器结构中使用了简单但高度精确的AlexNet架构。在其解码器结构中，使用了一个卷积和一个去卷积层。图5示出了架构FCN-AlexNet深度神经网络我们使用以下技术来训练FCN-AlexNet架构，并研究它们对其性能的影响。1. 更改输入到架构的输入图像的大小，并观察给定图像大小对性能的影响2. 使用三种不同的训练函数（SGDM、ADAM和RMSProp）进行训练S.巴林和古尔·埃姆雷·古拉克森工程科学与技术，国际期刊34（2022）1011746图五. FCN-AlexNet架构。3. 使用三种不同的像素分类层，三种不同的损失函数适用于分割4. 对图像使用GWA、Color Constancy和CLAHE，执行直方图均衡化，应用图像增强过程，并评估其对性能的ResNet[50]架构广泛用于分类研究。在ResNet[50]架构中，我们使用残差块来消除了在反向传播中由于层数的增加而引起的层之间的梯度损失的问题。如图1中的残差框图所示。 6，该类型的层结构的输出馈送到下一层和紧随其后的第三层或第四层。ResNet架构具有不同的深度。我们使用由18个子层组成的ResNet-18架构。图7显示了ResNet-18架构的结构。如前所述，FCN-AlexNet是一个简单但成功的分段架构。我们结合了FCN-AlexNet和ResNet-18架构来设计一个新的混合模型。ResNet-18架构是ResNet架构的最简单版本结合这两个模型，我们的目标是在不增加计算成本的情况下提高分割性能。混合模型由26层组成（图1）。 8）。混合模型的编码器结构由ResNet-18 和AlexNet架构组成，而其解码器结构由一个卷积层和三个反卷积层组成。去卷积层中的过滤器尺寸为4x4。该架构的解码器结构的另一种设计由一个卷积层和一个去卷积层组成。去卷积层中的过滤器尺寸为64 X 64。所有架构的训练参数为批量大小 4 ， epoch 为 30 ，学习率为0.0001。训练函数因此，我们在所有培训课程中都使用除了30个epoch之外，该架构还使用20个epoch和40个epoch进行训练20个epoch不足以用于训练，并且精度相当低，在40个epoch中获得接近30个epoch的精度值。此外，每50次迭代使用一次验证数据。优化算法用于在深度学习架构中训练层之间的神经元的权重。本研究评估了SGDM、ADAM和RMSProp优化算法在分割架构中的性能。带动量的随机梯度下降（SGDM）[51]是一种通过迭代方法优化目标函数的优化函数。它可以被认为是梯度下降优化的随机方法。它与SGD算法的不同之处在于使用了动量参数此SGDM算法参数有助于在正确的方向上加速梯度向量，从而加快收敛速度。已知在高维优化问题中减少计算负荷。Kingma和Ba[79]开发的自适应矩估计（ADAM）是一种随机优化方法，可计算需要一阶梯度的每个参数的自适应学习率见图6。残留块。S.巴林和古尔·埃姆雷·古拉克森工程科学与技术，国际期刊34（2022）1011747见图7。 ResNet-18深度学习网络架构。由Tieleman和Hinton开发的RMSProp[52]计算每个参数的新学习率。权重的学习率是该权重的最终梯度的幅度除以变化的均值。在分割研究中使用了成功的损失函数[53]。我们比较了三种损失函数的分割性能。交叉熵[54]是一种流行的基于分布的损失函数，在深度学习架构中具有较高的分类和分割性能。该函数在数学上表示为等式（2）[53]（T：目标，P：预测）：损失率：1-Tωlogn1-Tωlogn 1-Pω logn2S.巴林和古尔·埃姆雷·古拉克森工程科学与技术，国际期刊34（2022）1011748见图8。 FCN-ResAlexNet深度学习网络架构。加权交叉熵[55]是交叉熵的一种基于分布的变体，用系数[53]对正样本进行加权。我们使用类分布作为权重。该函数在数学上表示为等式（3）：损失量：1-Tωloss1-Tωlogs 1-Pωlogs 3根据Tversky[56]，Dice系数被广泛用于评估分割结果，以计算图像之间的相似性该度量也用作损失函数。Tversky损失函数是基于区域的函数，其是Dice系数的广义形式在Tversky损失函数中，假值（假S.巴林和古尔·埃姆雷·古拉克森工程科学与技术，国际期刊34（2022）1011749BbBPP阳性和假阴性）乘以系数。该函数在数学上表示为等式（4）[53]：如果像素是病变，则为p1}，如果像素不是病变，则为p0}）。ADAM在所有指标上都优于SGDM和RMSProp（表2）。因此，它被用于随后的所有培训。第三，三个损失函数和三个像素分类层上使用的分割分类FCN-AlexNet架构的第一层被重新安排，损耗¼pp200b1pp1-戊烯丙基溴b2Pp。1-p-腺苷酸交叉熵（等式（2））、加权交叉熵（等式（3））、Tversky（等式（4））算法（图5），然后比较它们的性能。表3显示了FCN-AlexNet架构，不同像元分类3.结果和讨论该研究评估了用于皮肤图像中病变分割的不同图像处理技术，并提出了一种混合深度CNN架构，该架构结合了深度CNN架构和迁移学习方法。所提出的架构由图1中的阶段组成。首先，我们使用不同的方法来分析影响深度CNN架构性能的特征（优化算法、损失函数、图像大小和质量）。其次，我们确定了FCN-AlexNet架构中性能最高的方法。第三，我们设计了一个混合FCN架构，它是基于FCN-AlexNet架构的AlexNet和ResNet CNN架构的组合。该研究是在MATLAB环境中进行的PC英特尔酷睿i7- 8750 H与16GB RAM和Nvidia GTX 1060 GPU运行Windows 10。像素精度、平均精度、平均IoU和频率加权IOU分割度量提出通过[57，58]和[34]用于比较模型。像素准确度、平均准确度、平均IoU、频率加权IoU的数学表示分别在等式（5）-（8）中给出像素精度¼Xnii =Xti 5层次。交叉熵损失函数在分类架构中给出了最佳结果，并且在分段架构中表现显著（表3）。加权交叉熵函数被认为在不平衡数据中表现良好[53]，但表现不佳，尽管病变像素的数量显著高于非病变像素的数量基于骰子系数的Tver-sky函数也表现不佳。在随后的评估中，在像素分类层中使用交叉熵损失在确定了输入大小、训练优化算法和像素分类层的损失函数后，采用了两种图像处理技术 GWA （ color constancy ）和 CLAHE（histogram equalization）来提高图像质量。这些算法被单独使用和组合使用。表4显示了结果。使用后GWA图像训练的架构优于其他架构。另一方面，用后CLAHE图像训练的架构在所有度量中具有最低分数，除了平均准确度。用GWA + CLAHE后图像训练的架构也具有较差的性能（表4）。编码器结构用于从图像中提取特征图。在比较了不同方法的性能i i应用于FCN AlexNet，我们决定重新设计编码器结构，以提高架构的性能，增加计算成本。FCN-AlexNet的原始架构的解码器结构包括单个去卷积平均准确度¼1Xniið6Þ过滤器大小为64x64的图层由于这种情况被认为是ncl平均IoU¼1X我我不是niiPð7Þ为了减少所提取的特征对softmax层的影响，在解码器结构中使用了由具有4 × 4滤波器尺寸的3个去卷积层组成的结构FCN的性能ResAlexNet架构，由单个反卷积ncl我t iJ. 仁智仁二以及解码器结构中的三种反卷积表5显示了FCN-AlexNet和FCN-AlexNet的性能频率加权IoU¼1Xtiniið8ÞResAlexNet由三个解卷积和一个PKTK我t ijujujuju.仁智仁二ISIC2017上的反卷积层。第二种设计的分段架构优于其他架构。其中nij是估计属于的i类的像素的数量对于第j类，ncl是类的总数，并且tiijnij是属于第i类的像素的总数。首先，研究了输入图像大小对对深度学习架构进行了评估。FCN-AlexNet架构的输入大小为224x224 x3、448 x448 x3和480 x360 x3。根据每个输入大小调整图像的大小，然后将其输入到架构中以比较它们的训练性能。表1显示了具有不同输入大小的架构的性能得分图像尺寸的增加略微增加了平均准确度和频率加权IoU，并使全局准确度和平均IoU降低了1%。深度学习架构的输入大小设置为224x224x3，因为它具有相对较高的性能和较小的计算负载。其次，使用 ADAM ， SGDM 和 RMSProp 的优化算法训练FCN-AlexNet架构，以评估它们对分割架构性能的影响。表2显示了结果。表6示出了具有第二设计的FCN-ResAlexNet和FCN-AlexNet架构的每个时期训练时间的持续时间。表5和表6中的结果表明，与FCN-AlexNet相比，FCN-ResAlexNet架构显示出准确性提高了0.35%，mIoU提高了0.53%，在训练时间期间每个历元仅增加了42秒。表7显示了FCN-AlexNet和FCN-ResAlexNet的性能，其中包括三个去卷积和一个去卷积层，用于ISIC 2018上的五重交叉验证。根据ISIC 2018数据获得的结果，提出的混合Res-AlexNet架构将准确性和mIoU性能值分别提高表5和表7显示，FCN-ResAlexNet架构在ISIC 2018数据集中取得了比在ISIC 2017数据集中更好的结果。ROC曲线通过对用于诊断的变量的灵敏度值与测试的假阳性率进行标点来获得ROC曲线的图形化方法使其易于掌握的敏感性和特异性之间的关系，4ÞPS.巴林和古尔·埃姆雷·古拉克森工程科学与技术，国际期刊34（2022）101174表110不同输入大小的FCN-AlexNet架构在ISIC 2017测试数据上的分割性能。图像尺寸总体准确度（%）平均准确度（%）平均IoU（%）频率加权IoU（%）448x448x392.2389.7881.4187.52360x480x392.6886.5480.8386.32224x224x393.1289.1082.4287.29表2在ISIC 2017测试数据上使用不同优化算法训练的FCN-AlexNet架构的分割性能。图像尺寸总体准确度（%）平均准确度（%）平均IoU（%）频率加权IoU（%）SGDM91.2288.8979.0884.44RMSProp92.5086.8380.5686.10亚当93.1289.1082.4287.29表3在ISIC 2017测试数据上具有不同损失函数的FCN-AlexNet架构的分割性能。图像尺寸总体准确度（%）平均准确度（%）平均IoU（%）频率加权IoU（%）加权互相90.4682.9775.7182.59特沃斯基91.7983.8178.1684.63交叉熵93.1289.1082.4287.29表4在ISIC 2017测试数据上使用Post-GWA和CLAHE图像训练的FCN-AlexNet架构的分割性能图像预处理滤波器总体准确度（%）平均准确度（%）平均IoU（%）频率加权IoU（%）CLAHE + GWA92.7386.6980.9786.41CLAHE92.6187.7481.0686.36GWA93.2489.6082.8187.54非滤93.1289.1082.4287.29表5不同解码器结构的FCN-ResAlexNet架构在ISIC 2017测试数据上的分割性能。细分架构总体准确度（%）平均准确度（%）平均IoU（%）频率加权IoU（%）FCN-ResAlexNet，93.4788.5282.9587.76三层反褶积FCN-ResAlexNet93.1987.3382.0387.19具有一个去卷积层FCN-AlexNet93.1289.1082.4287.29表6ISIC 2017测试数据上每个epoch的分段架构的训练时间分段架构每个epoch的具有三个反卷积层的FCN-ResAlexNet15世纪FCN-AlexNet 1258 sU-Net 3372 s测量。因此，图9中给出了显示使用ISIC 2017训练的分割架构的ROC曲线的图形，图10中给出了显示使用ISIC 2018训练的分割架构的ROC曲线的图形。图9和图10中给出的AUC值表明，所提出的方法比其他方法更有效U-Net和DeeplabV 3+是最先进的分割架构之一，使用ISIC 2017数据集进行训练，确定了最佳参数以比较所提出的架构。表8显示了所有架构的训练性能得分。FCN-ResAlexNet架构在ISIC 2017数据集的四个指标方面优于其他架构。U-Net分割架构的性能最低，训练周期最长。图11示出了由所提出的FCN-ResAlexNet架构预测的皮肤图像和分割图像的真实掩模图像。图11.c和图11.e中所示的图像是所提出的方法的地面真实掩模和分割结果对。在这些图像中，粉红色区域属于两个掩模图像（地面实况和FCN- ResAlexNet分割结果）的交集，白色区域属于地面实况图像，黑色区域属于FCN-ResAlexNet architec。S.巴林和古尔·埃姆雷·古拉克森工程科学与技术，国际期刊34（2022）10117411表7不同解码器结构的FCN-ResAlexNet架构在ISIC 2018测试数据上的分割性能。细分架构总体准确度（%）平均准确度（%）平均IoU（%）频率加权IoU（%）FCN-ResAlexNet，94.6591.8584.6490.21三层反褶积FCN-ResAlexNet93.1791.1881.5587.83具有一个去卷积层FCN-AlexNet92.8690.8080.8187.34图9.第九条。使用ISIC 2017数据集训练的分割架构的ROC曲线图10个。使用ISIC 2018数据集训练的分割架构的ROC曲线真实的面具图像。在图11.b、11.d和11.f中，分别显示了地面实况图像和FCN-ResAlexNet图11.b、11.d和11.f表明，所提出的方法获得了与地面实况相似的结果。在这种情况下，仅根据性能指标来评估所提出的方法的结果是不正确的表9显示了过去三年中使用文献中的ISIC 2017数据集进行的一些研究的性能值。当当前研究的性能与所提出的方法进行比较时，该研究已经达到了其主要目标。具有更复杂结构的架构的成就，如U-Net[59-由于根据单一性能指标进行评价是不正确的，因此进行了两种不同的秩分析，以根据所有性能指标进行一般评估，结果见表10和表12。在第一等级分析中，基于本研究中使用的所有指标（准确性、灵敏度、特异性、骰子和Jaccard指数）进行分析，而在第二等级分析中，仅基于骰子和Jaccard指数（分割性能指标）进行分析。当检查表10中ISIC 2017数据集的秩分析时，根据骰子和Jaccard指数，我们提出的方法是前3项研究之一。当检查表10中秩分析的前两种方法时，确定计算成本高于本研究中提出的方法在 Öztürk 和Özkaya[61]进行的基于FCN的研究中，可以看到建议使用不同颜色空间的方法在Liu等人[68]进行的研究中，可以看出提出了由三个不同模块组成的复杂架构因此，当检查研究细节时，认为本研究中提出的FCN-ResAlexNet架构查看表12中ISIC 2018数据集的结果，可以看出，根据骰子和Jaccard指数，所提出的方法是最佳所提出的方法的一般结果如下：1. 大尺寸或非对称尺寸的输入图像对体系结构的性能和计算成本产生不利影响。表8不同深度CNN架构在ISIC2017测试数据上的分割性能。细分架构总体准确度（%）平均准确度（%）平均IoU（%）频率加权

下载后可阅读完整内容，剩余1页未读，立即下载