DeepOCT：深度学习架构分析OCT图像上的黄斑水肿

82 浏览量更新于2024-01-06 收藏 811KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

工程科学与技术，国际期刊34（2022）101091完整文章DeepOCT：一种可解释的深度学习架构，用于分析OCT图像上的黄斑Gokhan Altana，a伊斯肯德伦技术大学，中央校区，A座，计算机工程系，I_skenderun，哈塔伊，土耳其阿提奇莱因福奥文章历史记录：2021年3月8日收到2021年11月13日修订2021年12月23日接受2022年1月24日在线提供保留字：深度学习卷积神经网络光学相干断层扫描黄斑水肿DeepOCTA B S T R A C T黄斑水肿（ME）是由于黄斑上的视网膜层脱离而发生的最常见的视网膜疾病之一。这项研究利用深度学习的优势，为OCT上甚至很小的病变提供了ME的计算机辅助识别。该研究旨在通过组成重要特征激活图和减少可训练参数，使用轻量级可解释卷积神经网络（CNN）架构在OCT图像上识别ME。CNN是一种有效的深度学习算法，包括特征学习和分类阶段。所提出的模型DeepOCT专注于实现高分类性能以及流行的预训练架构，除了在特征激活图上可视化最负责任的区域和病理之外，还使用较少的特征学习和浅密集层。DeepOCT封装了块匹配和3D滤波（BM3D）算法，使视网膜层变平以避免不同黄斑位置产生的影响DeepOCT识别OCT与ME的准确性、灵敏度和特异性分别为99.20%、100%和98.40%。DeepOCT通过减少可训练参数的数量提供了标准化分析、轻量级架构，并为大型和小型数据集提供了高分类性能。它可以通过简单的特征学习在不同层次上分析医学图像，而文献使用复杂的预训练特征学习架构。©2021 Karabuk University. Elsevier B.V.的出版服务。这是CCBY-NC-ND许可证（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍光学相干断层扫描（OCT）是一种能够控制视网膜状况的非侵入性眼科技术视网膜的图案由横截面层组成。不同层OCT图像通常用于通过可视化视网膜层中的眼部病理和形式退化来帮助识别眼科疾病[1]。OCT图像经常用于估计深度学习（DL）算法的性能，因为它提供了在微观分辨率下控制组织的设施[2，3]。随着医学图像处理技术和DL算法的发展，OCT计算机分析的研究越来越多文献报道黄斑水肿是最常见的眼科疾病黄斑是视网膜中央附近的色素组织。*通讯作者。电子邮件地址：gokhan. iste.edu.trq卡拉布克大学负责的同行审查视网膜。黄斑水肿描述为视网膜层脱离和黄斑中发生充满液体的病理，这是由于许多疾病，包括糖尿病、年龄相关性黄斑变性、遗传性疾病、损伤等[3传统的图像处理技术侧重于使用手工特征识别糖尿病性黄斑水肿（DME）[6，7]。近年来，大多数研究集中于将DL算法的有效性应用于OCT图像上DME的病理识别和诊断。迁移学习、特征学习和修剪预训练的卷积神经网络（CNN）架构是许多研究领域处理新型DL架构的常用方法。这些研究使用了各种DL架构，包括VGG-16[8-预训练DL架构的最新发展已经达到了难以超越的高水平。新论文的重点是组成轻量级架构，提供类似的功能以及更深层次的模型，同时确保可解释性和视觉支持，以进行临床验证。所提出的方法的重要性是组成一个轻量级的CNN架构，具有高DME识别性能，https://doi.org/10.1016/j.jestch.2021.1010912215-0986/©2021 Karabuk University.出版社：Elsevier B.V.这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表工程科学与技术国际期刊杂志主页：www.elsevier.com/locate/jestchG. 阿尔坦工程科学与技术，国际期刊34（2022）1010912除了可视化具有临床相关性的最负责任的视网膜激活图之外，OCT图像的计算机分析是为眼科医生提供更详细分析的重要本研究旨在通过组成重要特征激活图和减少可训练参数，使用轻量级可解释CNN架构在OCT图像上识别黄斑水肿。该论文在大型和小型OCT数据库上试验了各种CNN结构，以分类DME和非DME受试者。即使对于熟练的眼科医生来说，精确识别 DME 和小病变也所提出的DeepOCT架构通过特征映射执行小水肿的识别，通过预处理分配标准化分析，并通过减少OCT图像上的特征学习和微调监督模型来获得优化的轻量级DL架构在此，应用块匹配和3D滤波（BM3D）、视网膜层的平坦化对大规模和小规模数据集上的各种CNN架构该提案的主要贡献可概括为：1. 该建议是一种轻量级架构，与流行的预训练架构2. OCT扫描的标准化对准位置通过视网膜层分析的曲率校正和排除非视网膜切片来3. 该架构通过从头开始建模，达到了有前途的DME识别性能。因此，它构成了初始化权重的迁移学习，以适应知识到相关的医学图像的分析。4. DeepOCT分别在小规模和大规模数据集上实现，以查看所提出的架构的有效性。它确定了相同CNN架构对不同规格OCT扫描的鲁棒性和泛化影响。论文的其余部分组织如下：详细的介绍了相关的工作，并详细的比较了2.高光方案的优越性。数据库规格，预处理，建议DeepOCT架构，并在训练中的实验设置解释3。4给出了实验结果，并提出了建议。与最先进方法的完整比较在5中解释。最后，建议在6中结束。2. 相关作品随着深度学习的最新进展，一些研究人员已经致力于计算机辅助分析来识别视网膜疾病。现有工作的显著缺点是架构的可解释性和可解释性、有限的临床相关性、复杂的CNN架构以及它们对数据规范的依赖性。本部分解释了方案的主要差异，并进一步阐明了相关工作的主要贡献。训练CNN模型是一个耗时且依赖于大数据的过程，以获得更好的泛化能力。迁移学习能够通过重新描述已训练架构的知识来克服这些限制。迁移学习只有在初始问题和目标问题的相关性足以使体系结构的特征学习相关的情况下才便于适应。然而，它通常适用于OCT图像，用于从传统物体检测模型中识别DME[14，9，10，16DeepOCT是从头开始训练的，没有对预先训练的架构进行任何权重因子优化。因此，所生成的特征激活图呈现关于视网膜评估的低水平、中水平和高水平。DL算法的能力已经将分类和检测技术带到了一个新的水平。这就是为什么先进的图像处理技术配备了特征学习。组成更深的CNN模型提供了使用顺序卷积进行更详细分析的机会，除了训练网络所需的参数数量增加和时间复杂性作为缺点之外。研究人员最近的主要焦点是使用轻量级架构执行高分类成就以及更深和组合的模型，减少可训练参数的数量。虽然流行的预训练架构具有25 M（ResNet-50）[14]，60 M（AlexNet）[19，18]，138 M（VGG-16）[9-11]的各种分类参数，但与具有7.9 M参数的其他架构相比，DeepOCT是一种可接受的许多相关的工作报告了高的分类性能的准确性，特异性，灵敏度，曲线下面积比，以及更多使用各种技术。这些建议最关键的缺点是，在估计学习特征的责任以及它们对模型的影响程度方面，它是一个黑盒子[14，13，20，11，9，10，16即使该模型实现了高性能，估计学习过程的最负责任区域而不是预测类别对于临床实验更有价值近年来，可解释的人工智能技术已用于支持医疗决策支持机制和评估输出的临床相关性[8，19]。DeepOCT具有从头开始建模与医学图像相关的可解释的轻量级架构的优势由于OCT图像中存在强烈的斑点噪声，因此对去噪后的OCT图像进行分析一直是各种分割和视网膜病变定位研究的前提。与原始OCT扫描的分析[9，12，10，18，8，19]相反，即使是相同的手术，也在不同序列中应用了各种滤波技术，这些技术难以进行完整的比较。对于具有不同曲率和背景规格的严重DME病理，提取视网膜边界可能具有挑战性。因此，论文遵循了各种程序，包括中值滤波[14，9]、BM 3D[14，16]、基于稀疏性的块匹配[14，21]和替代图像生成[21]，用于提取眼科层。OCT特定的非自动裁剪，这是一个大规模数据库的耗时过程，用于提取DME的相关区域[13，20，10，16，17]。由于CNN架构能够学习OCT扫描的形状变体，因此DME的平坦视网膜层更有效地强制学习视网膜层中的病理[20]。该程序通过应用BM 3D进行噪声抑制和视网膜边缘细节保留，对OCT进行平坦化以进行曲率校正，对最高和最低边界检测进行二值化，以及自动裁剪以排除OCT中的非眼科模式，从而执行标准化预处理。虽然少数研究人员已经处理了这个问题，尽管通过在OCT扫描上训练他们自己的CNN架构来实现迁移学习的优点，但是没有一个相关的工作已经达到了可以克服所有这些缺点的令人满意的水平。在[14]中，对流行的CNN模型进行微调，以提高预处理OCT图像上DME的识别精度。他们在GoogLeNet、ResNet和DenseNet架构上尝试了各种深层删除。他们的建议G. 阿尔坦工程科学与技术，国际期刊34（2022）1010913将CNN模型中的参数数量减少到8.5 M，分类性能达到99%。然而，如果没有特征激活图与疾病病理之间的相关性，则无法清楚地理解使用这些成果的临床有效性。在[13]中，使用小波变换作为非监督学习来定义空间-频率域，比较了多种机器学习算法和CNN的效率。他们报告了CNN在黄斑病变诊断方面的优势。然而，他们使用有限数量的OCT扫描来训练他们的提案，这不适合DME病理学的推广。在[20]中，提出了一种具有新成本函数的多尺度CNN模型用于OCT上的黄斑水肿病理。他们将其CNN模型在训练时间和辨别能力方面的效率与现有CNN架构进行了比较，并指定了其CNN模型的优势。然而，它没有视觉评估来确保提出的CNN架构学习了哪些部分。在[12]中，通过将手工制作的特征（Gabor滤波器和尺度不变特征变换）与中间层的卷积块连接起来，提出了用于密集层的胸腔网络。他们的提案在ZhangLab数据库上进行了训练，并在OCT图像上实现了比VGG-16，DenseNet和Xception架构更高的训练时间和视网膜疾病识别性能。然而，流行的架构初始化了ImageNet上的权重，这对于OCT来说是无关的知识。一系列耗时的程序，包括各种手工制作的识别网络特征集成技术。此外，在数据增强中使用随机裁剪有可能为ZhangLab中的小型DME提供不相关的病理。在[21]中，通过将优化的非正交小波滤波器应用于OCT图像来预测替代特征生成他们提出了一种具有四个卷积层的轻量级CNN模型。该提案报告了去噪和掩模提取的盈利能力，以使用CNN模型识别视网膜疾病。然而，在训练中使用了少量的OCT扫描。这种情况下，在无监督的数据上，多样性的泛化程度很低，而不是复杂的表示。此外，视觉评估是不可能的学习数据和病理学的相关性最后，该提案必须强调对数据集使用规模和多样性的大多数文献使用有限数量的OCT扫描来训练CNN架构然而，即使使用数据增强，小规模数据集也不适合训练具有高泛化能力的深度学习模型。虽然不充分，但通过使用交叉验证[13，20，9，21，10，16分离训练集和测试集的保留程序用于大型数据库（ZhangLab）上的各种CNN架构[14，12，18，8，19]。鉴于相关的工作通常集中在结合可用的数据库或只是其中之一，本研究实现了单独的训练，每个OCT数据库为同一架构分层的数据库。因此，它确定了相同CNN架构对具有不同规格的OCT扫描的通用化影响3. 材料和方法3.1. 数据库OCT图像允许在临床检查期间检查视网膜层的状况，这是由于以体积呈现黄斑的不同扫描于是不同可以从患者获得扫描以评估病理、水肿和基于变性的眼科疾病的存在。病变的大小和对比度可能会因扫描的连续性而异。非DME受试者的OCT显示正常的中心凹结构特征，特别是中心凹凹陷和丛状层挤出。DME患者的OCT缺乏丛状层的挤出，导致视网膜脱离和具有浅凹的中心凹小坑，甚至对于不同的黄斑严重程度具有不同的大小。OCT图像有不同的本地、私有和开放访问临床数据库。最常用的数据库是Zhanglab[19]，新加坡眼科研究所（SERI）[22]和Duke数据集。ZhangLab是这些数据库中受试者数量和视网膜疾病范围的综合数据库相比之下，SERI和DUKE数据集在OCT图像和受试者数量方面存在限制在这项研究中，ZhangLab和SERI数据集被用来分析如何提出基于DL的黄斑水肿分类模型是有效的各种规格。ZhangLab数据集由62，489张不同分辨率的OCT图像（11，349张DME和51，140张正常）组成。SERI数据集收集自32个OCT体积（16个DME和16个正常）。它有每例受试者的128张B扫描OCT图像，分辨率为512x1024像素。在DL算法的训练中，数据集通常被划分为三个子集（训练、验证和测试）训练集用于训练模型，验证用于超参数优化以使用每个时期结束时的损失来评估训练，并且测试用于最终评估。10%的训练集被分割为验证集，以防止提出的CNN模型在训练中过度拟合。数据集按患者分层，而不是按OCT图像分层，因此，在训练集和测试集中均未使用来自患者的OCT图像。ZhangLab的测试组由500张图像（250张OCT和DME，250张正常OCT）组成，作为验证集。Zhang-gLab数据库的其余部分用于训练DME识别的拟议模型SERI数据集使用8折交叉验证算法分离，以避免过拟合。使用8折交叉验证和保留离散折组成的测试组提供了对使用独立特征集进行训练和测试的拟议DL模型的评价性能测量。在ZhangLab上使用支持的训练集和测试集对所提出的DL模型进行训练，以获得精确的性能匹配。由于数据有限，对SERI进行了8重交叉验证。3.2. 预处理由于原始OCT图像中的噪声，它们可能不具有用于视网膜水肿或病理学的完整分析的基本充分性因此，可以使用增强技术通过超越不清晰的边缘并消除非眼科背景表面来指定视网膜层和水肿病理。OCT图像具有低信噪比的斑点噪声。该提案的预处理步骤是（1）对OCT图像进行降噪以抑制噪声和保留视网膜边缘细节，（2）对OCT扫描的形状变化进行平坦化以进行曲率校正，（3）对OCT中的最高和最低边界进行二值化以检测，（4）在所获得的边界处进行裁剪以排除非眼科模式，以及（5）对图像进行缩放以馈送DL架构。在第一步中，将BM 3D算法应用于OCT图像以降低噪声[23]。BM 3D算法在OCT图像上具有比传统滤波方法更高的优越性和有效性[14是G. 阿尔坦工程科学与技术，国际期刊34（2022）1010914×~× ~×包括从OCT图像中的非局部区域指定一组相似的块，并分别提取块组的3-D小波表示[23]。BM 3D的Sigma参数是匹配步骤中的噪声值，以在OCT中提供噪声抑制和边缘细节保留使用更高的西格玛值导致视网膜中的嵌套层和尖锐边缘。小的sigma值在视网膜细节的恢复方面存在缺陷SERI数据集和ZhangLab数据集的BM 3D参数分别为45和35通过这种方式，OCT图像中的噪声得到了衰减，并且产生了更明显的边缘，以获得视网膜层。因此，视网膜层和病理中的形态细节变得更加突出[24，25]视网膜的位置根据OCT图像中的扫描而变化使用平坦化算法对于使视网膜层与统一的对准位置成比例以使形态变化最小化是必要的因此，采用[11]中的各向异性扩散策略作为预处理的第二步各向异性扩散策略包括区域内平滑、对齐单个视网膜边缘和执行视网膜曲率校正[26]。使用默认传导系数（kappa）值50作为梯度的函数和高斯模糊的标准差0.1，在一次迭代中应用各向异性扩散的参数使用定位的视网膜层的最高和最低位置水平裁剪每个OCT图像，所述最高以这种方式，排除了OCT图像中的非眼科模式。在最后一步，将每个OCT图像的大小调整为224 x224像素，以引入与流行的预训练网络（VGG-16、VGG-19、ResNet、EfficientNet等）相当的架构。图1描绘了DME和正常情况下的OCT图像和后续预处理阶段。3.3. 卷积神经网络CNN架构由特征学习组成，依次组合各种卷积层（CONV），池化层和具有多个全连接层（FC）的监督学习阶段[9，13，20，27，28]。最流行的预训练CNN架构是AlexNet[16在这项研究中，提出了一种新的轻量级CNN架构DeepOCT，用于识别OCT图像中的黄斑水肿在特征学习阶段，所提出的模型有三个CONV（降序和升序为32，64和96个特征图），其中卷积滤波器的大小在3 - 3 - 13 - 13的范围内变化。在每个CONV之后添加噪声是训练中的一种流行方法，可以提高 CNN 模型对实值输入的鲁棒性添加高斯噪声（l=0.35，r=0.01），以模拟每个CONV的预处理OCT图像CNN架构由最大池化（2 2）层组成，以识别特征图的主导像素。整流线性单元（ReLU）激活函数通常用于排除每次CONV后在分类阶段，分类器由一个输入层，其中最后一个CONV的特征图是平坦的，一个或两个 FC ，和一个输出层与 softmax 激活层（ DME-non-DME）。在每个FC的神经元品种经验迭代的范围为100 - 600个神经元。提出的CNN模型使用有限数量的FC和每个FC的神经元进行训练由于提出了一种不仅包括特征学习而且还包括DNN监督学习的实验设置利用各种卷积滤波器和密集层优化来执行蛮力（穷举）搜索。这种偏好的原因是基于没有免费的午餐定理。换句话说，每个特征图可以具有针对不同的密集层规范执行高广义预测的可能性。因此，训练假设是通过各种CONV层尝试不同的特征激活图，以通过学习最重要的特征来实现最高的分类性能。本研究成果属于试验中的最佳模型组合。特别是，在第一步的低级别特征上的顺序卷积层发展到达到中级和高级特征。这些建议是从头开始训练的，没有对预先训练的架构进行任何权重因子优化。此外，由于许多分类参数，包括dropout因子，学习率等，在监督学习中，所提出的架构使用固定参数作为每个FC的dropout因子0.5，50个epochs和50个批量大小。选择初始学习率为0.001、随机梯度下降算法稳定性系数为1 e-07的自适应矩估计（Adam）算法作为DL的优化器。在训练中没有使用早期停止。将softmax函数设置为输出函数，并将二进制交叉熵损失函数适用于所提出的DeepOCT。选择S形函数作为FC的激活函数。特征梯度激活图用于通过合并层的总和生成可视化图，以可视化所提出的DeepOCT架构的结果[29，30]。它能够在基于CNN的模型中为每个相应的类保留目标的空间位置信息OCT上的热图根据CNN架构呈现显著性程度，以确定哪些区域更适合诊断DME。因此，DeepOCT响应于验证OCT上的实际病理区域的预测作为可解释模型。对具有DME和非DME的OCT图像的分离的DL分析集中在相同的图像选项、具有相同参数的CONV层和固定范围的分类参数上。CNN模型的监督阶段是在有限的神经元数量、密集层、迭代和其他分类参数下进行的，以获得优化的DL模型。使用预测和实际标签的连续表分布来计算统计测试特征，以指定机器学习中模型的分类性能。因此，在CNN模型的比较中考虑了总体准确性、灵敏度、特异性、阳性预测值和阴性预测值[31]。应用R语言中的BDPV（Inference and Design forPredictive Values in Diagnostic Tests）软件包获得这些特征。此外，使用DeLong方法在95%置信区间（R中的pROC包）比较所提出的CNN模型的性能。它计算曲线下面积（AUC）的方差通过正态分布的分位数函数[32]。1分别呈现了各种CNN模型的最高成就。由于训练CNN模型非常耗时并且需要高级硬件（GPU），因此使用常见的预训练CNN模型和微调实现的DME识别的分类性能直接与文献进行比较。已对所提出的CNN模型用于各种CONV滤波器和密集层的效率进行了实验。两个数据集。4. 实验结果DeepOCT模型分别在不同的数据集（Zhang-gLab和SERI）上进行训练。2代表最高等级G. 阿尔坦工程科学与技术，国际期刊34（2022）1010915图1.一、使用DME（a）和非DME（b）的OCT图像的预处理阶段它包括BM 3D滤波以获得视网膜层之间更清晰的边缘，平坦化以处理OCT的标准化定位，二值化以获得视网膜层的最高和最低位置，以及裁剪以分别从OCT中排除非视网膜层。表1提出的CNN架构在DME识别上的分类性能（%）（92.75）（94.62）（91.83）（94.32）（91.23）CONV（4）@32 CONV（5）@64 CONV ZhangLab 92.40（91.8489.41（88.87-91.21）95.89（95.13(13)@96 FC1（230）SERI 93.410.87（91.77（96.80）94.970.79（92.34-95.85）91.850.86（91.11-（92.43）94.810.52（94.72-（94.94）92.091.03（90.79（93.17）CONV（4）@32 CONV（12）@64 ZhangLab 99.20（98.94100（99.87（DeepOCT）CONV（13）@96FC1（140）-FC2（470）SERI 99.120.26（97.27（99.41）98.58 0.21（98.44（99.02）99.660.34（98.89-99.87）99.650.25（99.51-99.99）98.600.32（96.59（99.24）CI：95%置信区间（在实验参数范围内的四种CNN架构的结果。所提出的方法在来自不同机构的具有各种规格的数据集上都工作得很好。使用三个CONV特征图，通过2个FC实现了最高的分类准确率，其中第一FC为140个，第二FC为470个神经元提出的DeepOCT模型（见2）在OCT图像上识别DME的AUC值为0.9828。使用DME OCT图像上的功能激活图指定最重要的功能。尽管存在许多视网膜层，激活图已经指定了用于测试OCT图像的黄斑区域。视网膜层的预处理模型结构数据集准确度（CI）灵敏度（CI）专属性（CI）净现值（CI）PPV（CI）CONV（12）@96CONV（5）@64CONVZhangLab94.90（91.2292.60（89.9397.20（96.2392.93（89.8697.06（96.13(13)@32 FC1（370）Seri八十一点二十1.26（80.79（82.48）90.531.42（89.80（93.17）71.881.03（71.63（73.42）88.360.94（88.29（90.04）76.300.97（75.83（76.93）CONV（12）@96 CONV（7）@64CONV（6）ZhangLab94.80（94.3499.60（99.4390.00（88.7999.56（98.5590.88（89.72G. 阿尔坦工程科学与技术，国际期刊34（2022）1010916表2比较使用不同CNN架构识别DME的相关工作相关作品CNN架构参数精度灵敏度特异性数据库Awais等人[9]VGG-16138海里87.5093.5081.00SeriPerdomo等人[10个国家]VGG-16138海里93.7593.7593.75SeriChan等[16个]AlexNET + PCA + SVM60米96.0797.6694.48SeriChan等[17个]AlexNET + SVM60米96.8893.75100Seri本研究DeepOCT7.9百万99.1298.5899.66SeriKaymak等人[18]AlexNET60米99.8010099.60ZhangLabLi等人[第十一届]VGG-16138海里98.8098.8098.80ZhangLabKermany等人[19]AlexNet60米98.2096.8099.60ZhangLab本研究DeepOCT7.9百万99.2010098.40ZhangLabLoO-CV：留一交叉验证，VGG：视觉几何组，PCA：主成分分析，SVM：支持向量机。对CNN模型的特征维度性能做出了积极贡献。这一发现证明，消除医学图像中的非视网膜区域提高了OCT检测黄斑异常的能力。就DeepOCT体系结构在DME识别方面的可视化性能而言，对于正常OCT图像，最负责任的区域位于中央凹凹处（见3.a）。最易受影响的区域是黄斑水肿区域，不仅广泛的黄斑病变如此，小的病变也是如此（见3.b-c）。DeepOCT具有充分的能力，可利用特征激活图和特征学习的优势识别小黄斑水肿。5. 讨论这项研究尽管CNN通常需要大量的数据来提出实际应用，但轻量级CNN模型对于SERI数据集和ZhangLab在DME和非DME分类上具有足够高的泛化性能。在本文中，通过BM 3D从OCT排除非视网膜层、平坦化和裁剪提供了对卷积表示的显著特性特征的学习。原始OCT导致特征维度的灾难，学习非眼科部分，并间接减速训练，即使是极少数的OCT图像。研究人员专注于各种预处理，特征提取和多种机器学习算法，以识别视网膜层的异常和不同病理。然而，识别DME可能是不充分的，因为视网膜层上的类似剥离可能导致OCT图像上其他视网膜疾病的类似症状。Sidibe等人旨在证明DUKE和SERI数据集上高斯混合模型组件的能力他们的方法在DUKE上的灵敏度和特异性分别达到80%和93%;在SERI上的灵敏度和特异性分别达到100%和80%[6]。此外，Lemaintreet al. 将多种机器学习算法应用于纹理特征，并报告了支持向量机在SERI上的效率，其准确性、灵敏度和特异性的分离性能率分别为93.33%、86.67%和100%[7]。近年来，大多数研究应用预训练的CNN模型来识别OCT图像上的病变和DMELee等人在Heidelberg Spectralis数据库中使用VGG-16，该数据库包含260万张OCT图像，并将年龄相关黄斑水肿与正常黄斑水肿分开，准确率为87.63%，灵敏度为84.63%，特异性为91.54%[8]。Rasti等人在DUKE上使用基于小波的CNN，同样在Heidelberg Spectralis数据库上使用。他们在Heidelberg上的精确度和灵敏度分别达到98.67%和98.22%;在DUKE上分别达到99.33%和99.11%[13]。此外，他们提出了一个图二、DeepOCT的架构包括具有内核规范的卷积层（CONV）、最大池化层、具有神经元的全连接层（FC）以及每个CONV之后的特征图的维度。G. 阿尔坦工程科学与技术，国际期刊34（2022）1010917图三. 通过DeepOCT对正常OCT（a）、OCT上的DME伴小黄斑水肿（b）和DME伴广泛黄斑水肿的特征激活图进行可视化。红色区域表示DeepOCT最可靠的功能激活图多尺度CNN模型，并在DUKE上报告了99.39%的准确率和97.78%的灵敏度[20]。Rong等人提出了一种使用代理图像生成的DUKE CNN结构。他们将DME与非DME分开，准确性、灵敏度和特异性的分类率分别为95.09%、96.39%和93.60%[21]。Ji等人使用许多ImageNet（Inception D2，V2，E3）CNN架构进行DME识别他们报告使用Inception V3模型的最高分类准确率为100%[15]。此外，他们在由1680张OCT图像组成的北京本地数据集上微调了相同的架构。他们将三种眼病分开，准确率为98.86%，敏感性为98.30%，特异性为99.15%。虽然这些研究集中在识别DUKE和本地数据集上的DME，但最近的研究通常使用有效的预训练CNN架构分析ZhangLab和SERI数据集尽管使用了相同的数据库，但对SERI进行完整的比较是不可能的，因为没有一篇共享的论文将受试者纳入训练或测试折叠。然而，在数据库和DL算法方面的最相关的文献在2。采用轻量级结构可以提高DME的识别性能，减少训练的计算量所提出的DeepOCT是一种功能架构，可对具有DME和非DME的OCT进行由于OCT图像计算机化分析的先进功能，DeepOCT可检测视网膜血管造影期间难以识别视网膜层上其他病变的小黄斑水肿OCT的清晰度可能会有所不同，甚至对于相同的受试者，这取决于医疗器械的规格、扫描类型、眼睛的姿势等。所提出的DeepOCT模型通过平坦化视网膜层（排除非视网膜层）、聚焦于眼科疾病的最具诊断性和确定性的区域以及在CONV之间传递低级和高级特征来实现标准化方法 DeepOCT 架构在 SERI 和 ZhangLab 数据集上实现了99.12%和99.20%的DME识别准确率该模型的主要优点是识别视网膜层中甚至小的黄斑水肿，减少专家的依赖性，检查，用标准化的方法处理视网膜层，并通过与流行的CNN架构进行比较，提出一种优化的轻量级CNN模型。尽管人工智能模型在许多领域都达到了足够高的能力，但拥有黑箱架构仍然是一个主要问题，无法解释预测的输出。这种情况导致人们怀疑基于AI的系统如何做出决策，如何获得最佳的高泛化能力，如何理解预测的直接性和局限性，AI模型学到了什么，等等。这是一个很大的必要性，以揭示的扩展，是值得信赖的临床医生，而不是专注于什么，但在医疗决策支持系统的输出。即使预测是真的，学习特征的可视化的确定性和医学图像中病理学特征的精确检测也是AI系统临床相关性通过关注这个问题，可解释人工智能的概念已经被引入作为一种新的方法，以增强智能算法的可解释性和可理解性，使用特征激活图，输出可视化技术和基于规则的混合学习模型。特征激活图和疾病症状之间的相关性也由眼科医生评估在眼科评估中，学习的特征激活图（3中的红色区域）对识别DME的病理区域和非DME的中央凹小凹具有很高的该模型的主要优点是识别视网膜层中即使很小的黄斑水肿，减少专家的依赖性，用标准化方法检查视网膜层，并提出与流行CNN架构相比优化的轻量级CNN模型。6. 结论所提出的模型的主要优点是使用优化的修剪CNN架构来估计OCT图像上的DME。DeepOCT完全具有DL的优点G. 阿尔坦工程科学与技术，国际期刊34（2022）1010918与预训练的CNN（GoogleNet，AlexNet，VGGNet，DenseNet等）一样，通过简单的特征学习和FC实现了高泛化能力。在OCT数量有限的情况下，DeepOCT在SERI数据集上实现了DME识别的高度通用性。此外，根据经验，在第一次CONV时使用大滤波器并通过CONV减小滤波器大小不太可能影响性能。相反，在CONV1处使用小滤波器并逐层增加滤波器大小可提高DeepOCT的分类性能。因此，在第一个CONV中生成的低级特征被转移到随后的CONV以提取中级和高级特征。预处理中OCT扫描的展平和裁剪可能被评估为对机器学习算法产生负面影响的估计数据丢失。然而，从OCT图像中排除责任较低的非视网膜区域，除了提供标准化分析外，还增强了黄斑水肿的可视化学习的特征激活图可以用回归概念向量[33]来支持，以增强可解释性。由于DL模型的复杂性，医学图像处理依赖于高容量设备，并且需要高能量供应来预测疾病。此外，它导致延迟响应和长时间的分析。所提出的轻量级DL模型是一种具有低数量分类参数的节能模型，用于在OCT上识别DME它提供了节省电池寿命的低能耗、使用节能电子设备的高精度预测、移动设备的高效部署能力、低成本嵌入式系统和医疗物联网设备主要脚本、随机OCT扫描上用于视觉验证的可用功能激活图以及DeepOCT的权重将在[34]中完全可用，用于训练、测试和轻松适应性to transfer转移learning学习.DeepOCT最薄弱的方面是医疗器械的多样性。每种医疗设备都有其规格，包括降噪技术、横向分辨率、角度视图等。因此，尽管DeepOCT具有较高的DME识别性能，但在作为诊断工具之前，仍需要使用来自不同医疗器械的各种OCT扫描然而，由于DeepOCT能够识别小黄斑水肿，因此DME作为眼科医生的替代决策支持工具具有潜在的临床意义。数据可用性声明本文的基础数据可以在 Mendeley 数据库中找到，网址是https://doi.org/10.17632/rscbjbr9sj.2。竞争利益作者声明，他们没有已知的竞争性财务利益或个人关系，可能会影响本文报告的工作。确认作者感谢博士。阿卜杜拉BEYOGLU为他的眼科评估在验证和评估的建议。作者也感谢编辑和匿名审稿人提供了有见地的建议和意见，以提高研究论文的质量。引用[1] J.S. Schuman，C.A. J.G.普利亚菲托藤本，J.S. Duker，眼科疾病的光学相干断层扫描，SlackNewJersey（2004），https://doi.org/10.1097/01.opx.0000431611.44976.20。[2] J. Wu，Y. 张，J. Wang，J. Zhao，中国粘蝇D. Ding，N.陈湖，澳-地Wang，X.ChenC. ，马缨丹属Jiang ，X.Zou ，X.Liu ， H. 肖氏Y. 田镇Shang ，K.Wang，X.Li ，G.Yang，J. 风扇，AttenNet：OCT图像中基于深度注意力的视网膜疾病分类，收录于：计算机科学讲义（包括人工智能子系列讲义和生物信息学讲义），Springer，doi ： 10.1007/978- 3-030-37734-2_46 ， 2020 年，第 10 页。 565 - 576 。 doi ：10.1007/978-3-030-37734-2_46..[3] M.巴达尔湾Haris，A. Fatima，深度学习在视网膜图像分析中的应用：综述（2020）。doi：10.1016/j.cosrev.2019.100203..[4] C.A. Puliafito，M.R.Hee，C.P.Lin，E.Reichel，J.S.舒曼，J.S.杜克，J.A.Izatt，E.A. 斯旺森，J.G.黄明，黄光。doi：10.1016/S0161-6420（95）31032-9..[5] K. Alsaih，M.Z. Yusoff，T. B.唐岛Faye，F. Mériaudeau，光学相干断层扫描中年龄相关性黄斑变性分割的深度学习架构分析，生物医学计算机方法和程序195（2020），https://doi.org/10.1016/j.cmpb.2020.105566105566。[6] D. Sidibé，S.桑卡尔湾Lemaektre，M.Rastgoo，J.Massich，C.Y.张先生谭，D. Milea，E. Lamoureux，T.Y. Wong，F. Mériaudeau，使用光谱域光学相干断层扫描图像识别DME患者的异常检测方法，生物医学计算机方法和程序139（2017）109 https://doi.org/10.1016/j。cmpb.2016.11.001网站。[7] G. Lemaektre，M. Rastgoo，J. Massich，C.Y.张泰源Wong，E.黄氏Lamoureux，D.Milea，F. Mériaudeau，D. Sidibé，使用局部二进制模式对SD-OCT图像进行分类：DME检测的实验验证，眼科学杂志（2016），https://doi.org/10.1155/2016/3298606。[8] C.S. Lee，D. M.鲍曼，A.Y.Lee，Deep Learning Is Effective for ClassifyingNormal vs Escherichia coli Related Macular Degeneration OCT Images ，Kidney International Reports 1 （ 2017 ） 322arXiv ： 1612.04891 ， doi ：10

下载后可阅读完整内容，剩余1页未读，立即下载