深度学习方法的跨数据集分析和基于投票的COVID-19检测

161 浏览量更新于2024-01-07 收藏 1.16MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

医学信息学解锁20（2020）100427使用深度学习在CT图像中检测COVID-19：基于投票的方案和跨数据集分析Pedro Silvaa，Eduardo Luz a，Guilherme Silva b，Gladston Moreiraa，*，Rodrigo Silva a，Diego Lucioc，David Menotti ca巴西MG，乌鲁普雷图联邦大学计算机系b巴西MG联邦大学控制与自动化工程系c巴西巴拉那联邦大学信息学系A R T I C L EI N FO保留字：COVID-19深度学习高效网络肺炎胸片A B S T R A C T早期发现和诊断是控制COVID-19传播的关键因素。最近提出了许多基于深度学习的方法，用于CT扫描中的COVID-19筛查，作为自动化和帮助诊断的工具。然而，这些方法遭受以下问题中的至少一个：（i）它们独立地处理每个CT扫描切片，以及（ii）用来自相同数据集的图像集来训练和测试所述方法。单独处理切片意味着同一患者可能同时出现在训练集和测试集中，这可能产生误导性结果。它还提出了一个问题，即是否应将同一患者的扫描作为一个组进行评估。此外，使用单个数据集引起了对方法泛化的担忧。不同的数据集往往呈现不同质量的图像，这些图像可能来自不同类型的CT机，反映了它们来自的国家和城市的条件。为了解决这两个问题，在这项工作中，我们提出了一种高效的深度学习技术，用于基于投票的COVID-19筛查方法。在这种方法中，来自给定患者的图像在投票系统中被分类为组。该方法在两个最大的COVID-19 CT分析数据集中进行了测试，并基于患者进行了分割。一个跨数据集的研究，也提出了一个更现实的情况下，数据来自不同的分布来评估模型的鲁棒性交叉数据集分析表明，深度学习模型的泛化能力远远不能接受，因为在最佳评估场景下，准确率从87.68%下降到56.16%。这些结果强调，针对CT图像中COVID-19检测的方法必须显著改进才能被视为临床选择，并且需要更大和更多样化的数据集来评估现实场景中的方法1. 介绍2020年3月，世界卫生组织（WHO）正式宣布由SARS-CoV-2引起的COVID-19爆发，一场流行病COVID-19具有高度传染性，并可能演变为致命的急性呼吸窘迫综合征（ARDS）。早期发现和诊断是控制COVID-19传播的关键因素。最常用的筛查方法是逆转录聚合酶链反应（RT-PCR）检测。然而，这是一种费力的方法，一些研究报告称其在早期阶段的敏感性较低[1]。胸部扫描，如X射线和计算机断层扫描（CT）扫描已被用来确定肺部病变的形态学模式，COVID-19然而，COVID-19诊断的准确性胸部扫描强烈依赖于专家[2]，深度学习技术已被研究为自动化和帮助诊断的工具[3计算机断层扫描，或CT扫描，产生器官，骨骼，软组织和血管的详细图像。CT图像允许医生识别内部结构并查看其形状、大小、密度和纹理。与传统的X射线不同，CT扫描产生身体给定区域的一组切片，而不覆盖不同的身体结构。因此，CT扫描比传统的X射线更能详细地了解患者的病情。该详细信息可用于确定是否存在医疗问题，* 通讯作者。电子邮件地址：gladston@ufop.edu.br（G.Moreira）。网址：http://www.decom.ufop.br/csilab/（G.Moreira）。https://doi.org/10.1016/j.imu.2020.100427接收日期：2020年8月5日;接收日期：2020年9月3日;接受日期：2020年9月8日2020年9月14日网上发售2352-9148/©2020的作者。发表通过 Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证（http://creativecommons.org/licenses/by-nc-nd/4.0/）中找到。可在ScienceDirect上获得目录列表医学信息学期刊主页：http://www.elsevier.com/locate/imuP. Silva等人医学信息学解锁20（2020）1004272Fig. 1. 来自SARS-CoV-2 CT扫描数据集的CT图像样本：COVID-19阳性（上）和非COVID-19阳性（下）。以及问题的严重程度和确切位置。出于这些原因，最近提出了许多基于深度学习的方法用于CT扫描中的COVID-19筛查[9实现上述研究的主要瓶颈是缺乏高质量的综合数据集。可能第一次尝试创建这样的数据集是所谓的COVID-CT数据集[15]，它由从研究论文中挖掘的图像组成。参考文献中使用了该数据集的不同版本。[9对于其最新版本，报告的最高准确度、F1评分和AUC分别为86%、85%和94%[9]。最近，Soares等人[14]公开了另一组CT扫描。它由巴西圣保罗市医院的2482次CT扫描组成。他们报告的准确性、灵敏度和阳性预测值分别为97.38%、95.53%和99.16%。这两个数据集是迄今为止最大的公开数据集。可以看出，在它们中的每一个中获得的最佳结果的差异是显著的，这提出了两个问题：（i）结果中的差异是由于数据集中的差异吗？(ii)在一个数据集中训练的模型在用另一个数据集测试时是否具有良好的性能？本文旨在回答这两个问题。最佳性能技术的另一个缺点是它们的参数数量巨大，直接影响它们的足迹和延迟。改进这两个指标可以使模型更容易嵌入到移动应用程序中，并且如果作为每秒接收大量请求的Web服务提供，则可以减轻服务器的负担。此外，具有更紧凑的基线模型允许利用更高分辨率的输入，而不会使计算成本过高。一般来说，计算成本是影响可访问性和可用性的重要因素，向公众展示技术。因此，这项工作的主要目标是：（i）提出一个高质量但紧凑的深度学习模型，用于在CT扫描中筛查COVID-19;（ii）首次解决上述关于两个最大数据集的问题;以及（iii）提出一种基于投票的评估方法。为了生成一个有效的模型，我们利用并扩展了深度人工神经网络的EfficientNet家族，以及数据扩充过程和迁移学习。根据之前的评估方案[9，14]，提供了COVID-CT数据集（准确度为87.60%）和SARS-CoV-2CT扫描数据集（准确度为98.99%）的最新结果。基于投票的方法在CT图像中的Covid-19检测这项工作的其余部分组织如下。第2节介绍了COVID-CT [15]和SARS-CoV-2 CT扫描[14]数据集的详细信息。方法在第3节中描述，实验和结果在第4节中描述。最后，第5节给出了本文的结论2. 数据集本节介绍本工作中考虑的两个数据集。据我们所知，这是迄今为止最大的两个公共数据集。2.1. SARS-CoV-2 CT扫描数据集SARS-CoV-2 CT扫描数据集[14]包括来自120名患者的2482次CT扫描，其中1252次CT扫描来自60名SARS-CoV-2感染患者图二. 图像中不同对比度的比较P. Silva等人医学信息学解锁20（2020）1004273××图3.第三章。来自CO V ID -C T 数据集的 COVID-19阳性（上）和非COVID-19阳性（下）CT 图像的示例。图四、带有文本信息的图像示例。表1数据集分布。数据集COVID-19非COVID-19问题患者数量图片数量患者数量图片数量SARS-CoV-2 CT扫描[14]601252601230非标准图像尺寸非标准图像新冠肺炎[15]21634955463图像的非标准尺寸图像的非标准对比度图像上的文本信息来自男性（32）和女性（28），以及来自男性（30）和女性（30）的60名非SARS-CoV-2感染的患者的1230张CT扫描图像，但表现出其他肺部疾病。数据收集自巴西圣保罗的医院。在该数据集中，图像由打印CT检查的数字扫描组成，并且它们没有关于图像大小的标准（数据集中最小图像的尺寸为104 153，而最大图像的尺寸为484 416），图1显示了一些示例。该数据集还缺乏关于图像对比度的标准化，如图11所示。二、对于方法评估，参考文献[14]中提出的方案建议将数据集随机分为训练（ 80% ）和测试（ 20% ）部分。该数据集可在https://www.kaggle.com/plameneduardo/sarscov 2-ctscan-dataset上获得。2.2. COVID-CT数据集为了组装COVID-CT数据集[15]，从2011年1月起，从medRX iv和biRXiv存储库中保存的科学文章（预印本）中收集了感染COVID-19的患者的CT图像。19 日至 3月 25 日，医院也捐赠了一些图像（http://medicalsegmentation.com/covid19/）。PyMuPDF软件用于从手稿中提取图像，以保持高质量。手动提取Meta数据并与每张图像相关联：患者年龄、性别、位置、病史、扫描时间、COVID-19严重程度和医疗报告。共收集了216名患者的349张图像。关于健康和非新冠肺炎患者，作者从其他两个数据集（MedPiX数据集、LUNA数据集）、Radiopaedia网站以及PubMed Central（PMC）提供的其他文章和文本中收集了图像。共收集了55名患者的463张图像。与之前的数据集类似，COVID-CT数据集定义了图像大小和对比度的标准。图3示出了一些示例。同样重要的是要强调，一些图像包含可能干扰模型预测的见图四、提出了一个协议，用于创建训练，验证和测试集。选择由医院捐赠并直接从医疗设备（LUNA和Radiopaedia）中提取的COVID-19图像来组成验证和测试集。其余的─P. Silva等人医学信息学解锁20（2020）1004274=-[客户端]图五. MBConv Block [16]. DWConv代表dependenconv，k3X 3/k5X 5定义内核大小，BN 是批量归一化，HxWxF表示张量形状（高度，宽度，深度），x1/2/3/4是重复层数的乘数。从科学文章和手稿中提取-被保留以组成训练集。该数据集可在https://github.com/UCSD-AI 4 H/COVID-CT上获得。2.3. 最后的问候表2EfficientNet基线网络：B0架构。阶段操作者决议通道数层数1Conv3X 3224X 2243212MBConv 1，k3X 3112X 1121613MBConv6，k3X 3112X 1122424MBConv6，k5X 556X 564025MBConv6，k3X 328X 288036MBConv6，k5X 514X 1411237MBConv6，k5X 514X 1419248MBConv6，k3X 37X 732019Conv 1X 1/合并/FC7X 7一千二百八十1模型的质量。以这种方式，该预处理步骤成为网络的另一个参数。3.2. 有效的CovidNetEfficientNets是一系列人工神经网络，其中基本构建块是移动反向瓶颈Conv块MBconv [16]，如图所示。五、表2给出了一个典型的EfficientNet架构，特别是B0模型。实现EfficientNet架构的主要思想是从表2中提供的一个高质量但紧凑的基线模型开始，并以系统的方式逐步扩展其每个维度，使用一组固定的缩放系数。一个有效网络可以由三个维度定义：（i）深度;（ii）宽度;和（iii）分辨率，如图所示。六、每个维度由参数φ根据等式缩放（1）其中α= 1。2 β= 1。1，γ= 1。1是通过网格搜索实验获得的常数。改变φ，可以得到其他的导出网络。例如，φ1产生有效网络B1，φ2给出提升到EfficientNet B2，等等。根据参考文献[17]，方程。（1）在计算成本和性能之间提供了良好的折衷。深度=α宽度=β表1总结了本节中提供的数据集。在表中可以观察到数据集中识别的问题，以及患者数量与图像数量之间的关系。分辨率=γS. t.α ⋅ β2 ⋅ γ2≈2α≥1，β≥ 1，γ≥ 1（一）每个类别（COVID和非COVID）。3. 方法在本节中，提出了基于CT扫描的COVID-19筛查的拟议方法。为此，我们扩展了EffiecientNet系列的架构，并使用来自健康和SaR-CoV-2感染患者的CT图像训练模型。CT图像来自上一节所述的数据集，并经过下文所述的预处理程序。3.1. 预处理预处理是计算机视觉应用中非常常见的过程。预处理技术可以用于去除不必要的噪声，强调图像中有助于识别任务的方面，甚至有助于深度学习训练阶段。在这项工作中，一个简单的像素强度归一化的范围内，0， 1适用。这种预处理对于训练阶段的模型收敛是必要的。对于卷积网络模型，输入图像通常会调整大小以保持与网络架构的兼容性。由于Effi-cientNets在延迟和延迟方面具有较低的计算成本，因此可以利用更高分辨率的输入图像。因此，我们还调查了在不同的输入分辨率的影响，在[18]中，向基线模型中添加了四个新块，以提高对X射线图像的COVID-19识别。在这里，我们提出了针对CT图像的修改，并将六个新块添加到Effi- cientNet B 0架构中。通过网格搜索获得这些区块，见表3和表4。考虑的搜索空间为：层[1到6]，神经元数量[100到1024]，激活函数[ReLu，Sigmoid，Swich]，丢弃[0进行了两次搜索。一个针对较浅的架构（层的数量削减到4 -表3），另一个针对较深的架构（表4）。在模型的顶部添加了一个新的全连接层（FC），以适应新的域的分类任务。我们强调了组成块的以下操作：批量归一化（BN），dropout，和Swish激活功能。批量归一化操作将层的输出约束在特定范围内，强制均值为零，标准差为1。这是一种正则化，增加了神经网络的稳定性，并加速了训练[19]。Dropout[20]操作也可以作为一种正则化，通过抑制一些神经元，从而模拟多个神经网络的袋装集合dropout参数定义了受抑制神经元的数量（一层神经元的0尽管Rectified Linear Unit（ReLU）被认为是最流行的激活函数，但在这里我们探索swish激活函数[21]。P. Silva等人医学信息学解锁20（2020）1004275（）=（）+=1=2=表3见图6。基于三个参数的有效净复合标度（改编自参考文献[17]）。其他数据集或其他领域称为迁移学习[23]。每-更小的架构-SARS-CoV-2 CT扫描数据集上实现的块的示例- EfficientNet-CT模型。(NC=类数）。载物台操作员分辨率#通道#层当训练数据很少时，从预先训练的网络形成微调可以使深度架构的使用成为可能，因为网络已经学习了可以重用110BN/辍学300X 3007X 732 11280 1[24]第10段。在目前的工作中，我们几乎没有图像来进行训练，特别是COVID-19类。因此，迁移学习成为11FC/BN/Swich/Dropout12FC/BN/Swich13FC/Softmax 1 NC 1表4更深入的架构-SARS-CoV-2 CT扫描数据集上实现的块的示例- EfficientNet-CT模型。(NC=类数）。载物台操作员分辨率#通道#层1势在必行我们的模型继承了EfficientNet的几个层（见表2），新层随机初始化为零均值。EfficientNets最初是为Imagenet数据集训练的[22]。因此，我们遵循以下步骤将leanring从一个域转移到另一个域：1. 将权重从一个EfficientNet模型复制到新模型;2. 修改新模型的架构，包括顶层的新层;10BN/辍学7X 71280 13. 随机初始化新层;11FC/BN/Swich/Dropout 1 2048 111FC/BN/Swich/辍学1 1024 112FC/BN/Swich13FC/Softmax 1 NC 1ReLu可以正式定义为f x max0，x，而swish函数由以下等式定义：f（x）= x <$（1 + exp-x）-1。（二）Swish激活在最小化损失过程中产生平滑曲线，而与此相反，ReLu产生突变。此外，swish函数不会将小负值归零我们相信这些因素可能与捕获数据下的模式有关[21]。3.3. 培训由于其复杂性，深度学习模型需要大量4. 定义哪些层将通过学习过程，哪些层将被冻结;以及5. 通过根据损失函数和优化算法更新权重来执行学习过程。在这里，权重使用Adam Optimizer更新，最大学习率为10- 4。我们计划在停滞的情况下将学习率降低10倍。时期的数量固定为10。3.4. 评估指标这里使用五个指标来评估模型：准确性（Acc），COVID-19敏感性（SeC），COVID-19阳性预测（PC），F1评分（F1）和受试者工作曲线下面积（AUC），即，加速度TP+TNTP+FP+TN+FNSeC= TP避免过度拟合。然而，对于大多数现实生活中的问题，数据并不丰富。事实上，很少有数据丰富的情况，例如ImageNet [22]数据集。为了克服这个问题，可以依靠两种技术：数据增强和迁移学习。在这项工作中，我们利用了这两种技术，我们描述如下。TP+FNTP+PC=TP+FPF+PC+PC+SeC（三）3.3.1. 数据增强数据增强包括通过变换图像而不丢失语义信息来增加训练样本。在这项工作中，我们对训练样本应用了三种变换：旋转，水平翻转和缩放。图7呈现了所应用的数据增强的示例。这样的变换保留了图像，并且不会阻止医生解释图像。3.3.2. 迁移学习从预先训练的神经网络开始，重新训练它以适应其中TP、TN、FN和FP代表正确分类的COVID-19样本、正确分类的非COVID-19 样本、分类为非COVID-19的COVID-19 样本、分类为COVID-19的非COVID-19样本。为了与文献进行比较，我们还报告了受试者工作曲线下面积（AUC）的结果。受试者工作曲线是真阳性率（A.K.A.灵敏度SeC）与假阳性率（FPR）。FPR由等式（4）定义。P. Silva等人医学信息学解锁20（2020）1004276=C见图7。使用Augmentor python包应用数据增强。应用于图像的变换有：旋转（顺时针或逆时针0可以根据概率应用/组合所有或没有改变（图由作者创作FPRFPCTNC+FPC（四）4.1. 设置1：对大型数据集进行5倍评估为了评估所提出的方法的性能，我们测试了AUC越高，模型在区分图像类别方面越好。4. 实验与讨论在Intel（R）Core（TM）i7- 5820 K CPU上进行了EX3.30 GHz，64 GB RAM，一个12 GB的Titan X Pascal，以及Python的Tensor-Flow/Keras 框架。源代码和预训练模型可在https://github.com/ufopcsilab/EfficientCovidNet中获得。在下面的小节中，我们介绍了本工作中探索的三个实验设置。训练模型以0.001的学习率开始，使用分类交叉熵损失，使用Adam Optimizer进行20个epoch。在第一个设置中，在第4.1节中，我们调查了两个研究数据集的最新方法报告的结果的差异。COVID-CT数据集的最佳方法报告了86.0%的准确率[9]。对于SARS-CoV-2 CT扫描数据集，最先进的方法达到了97.38%的准确度[14]。然而，SARS-CoV-2 CT扫描数据集的图像明显多于COVID-CT数据集，并且患者数量相同（差异）。为了评估这种差异是否是由于评估协议，我们进行了两个实验。我们调查随机选择样本/图像用于训练集和测试集的影响，在第二步中，我们评估执行由个体指导的选择的影响，即确保在训练集和测试集中没有来自同一个体的样本。在第二个设置中，在4.2节中，我们研究了一个非常重要的方面，这是模型的泛化能力。一个模型只有在它也可以推广到其他分布或其他数据集的数据时才有用。在这方面，我们评估了使用SARS-CoV-2CT扫描数据集训练的模型在面对来自另一个数据集COVID-CT数据集的图像时的行为。我们遵循的数据分裂protocol建议在参考。[15 ]第10段。最后，对于第三种设置，我们仅使用COVID-CT数据集探索我们的EfficientCovidNet模型，考虑参考文献中提出的协议。[15 ]第10段。该设置旨在扩大所提出的方法与文献的比较，因为该数据集是迄今为止最受欢迎的。在这里，我们还探讨了改变输入图像大小的影响。Soares等人提出的协议[14]和使用5重交叉验证的三种不同场景：（i）“随机”，（ii）“切片”和（iii）“投票”。“随机”评估将数据随机划分为训练集和测试集。“切片”评估考虑所有CT图像彼此独立，但考虑患者划分，即我们在训练集和测试集中同时防止来自一个个体的样本。在这种方式下，模型将始终使用来自未知个体的样本进行评估。最后，“投票”评估考虑个体的所有图像和投票方案，以实现每个个体而不是通过实例或图像的诊断。考虑到在单个检查中针对单个个体采集多个CT图像，我们认为疾病模式不会在所有情况下都存在。因此，采用投票办法进行评价，考虑到一个人的所有可能情况，可以增加成功的机会。4.1.1. 结果根据参考文献中提出的协议[14]数据分为训练、验证和测试。本工作中提出的方法增强了测试集上的所有度量，如表5所示。尽管表5中给出了出色的结果，但我们认为这些结果被高估了。基于这一事实，我们引入了5重分类，并对原始方案进行了一些变更，结果见表6。与其他两种方法（“切片”和“投票”）相比，“随机”评估呈现出更好的结果。原因之一是由于训练集和测试集中来自同一患者/个体的数据，这导致高估结果。基于这一事实，我们的假设是，一种方法倾向于学习与个体相关的模式，而不是COVID模式。在“切片”评估中表5参考文献中提出的分类方案[14 ]第10段。方法Acc（%）SeC（%）+PC（%）Soares等人[14个]97.3895.5399.16该方法98.9998.8099.20P. Silva等人医学信息学解锁20（2020）1004277表6通过切片和投票进行5重分类入路Acc（%）SeC（%）+PC（%）随机98.5± 0.4 98.6±0.6 98.4 ± 0.6切片86.6± 10.1 94.8±4.5 79.7 ± 20.9表决89.6± 5.1 92.0±10.0 77.5 ± 23.3表7跨数据集结果。表8使用EfficientNet-B 0作为基础网络的自定义输入深度输入尺寸Acc（%）SeC（%）+PC（%）F1（%）300X 30076.8569.3980.0074.32350X 35080.7979.5980.4180.00400X 40083.2580.6184.0482.29450X 45083.2581.6383.3382.47500X 50083.7483.6782.8383.25训练数据集测试数据集访问（%）SeC（%）+PC（%）SARS-CoV-2 CT扫描数据集[14]SARS-CoV-2 CT扫描数据集[14]新冠肺炎[15]（火车）59.12 64.14 54.95新冠肺炎[15]（测试）56.16 53.06 54.74SARS-CoV-2 CT扫描数据集[14]COVID-CT [15]（列车+测试）COVID-CT [15]（列车+测试）SARS-CoV-2 CT扫描数据集[14]58.31 61.03 54.9045.25 54.39 46.36测试集。观察到降级，这清楚地表明“随机”评估的高估与“切片”评估相反，“投票”评估考虑个人的所有图像，以决定个人是否被感染或不.值得强调的是，在两种方法中使用相同的模型，即通过图像（仅一个“切片“的肺）训练的模型。由于CT扫描的性质，我们认为疾病模式不会在单个CT检查的所有切片（实例/图像）中表现出来，“切片”和“投票”评估的结果反映了这一点。我们认为这会产生假阳性/假阴性，因此会影响方法的数值（见表6）。此外，这个问题可以被看作是一个多实例学习（MIL）问题[25]，基于MIL的方法可能是未来工作的一条有前途的道路比较表5和表6的结果，我们认为在训练和测试中来自同一个体的样本的存在往往会导致对方法的高估。为了避免这个问题，有必要确保考虑个体的数据集的划分，并使用跨数据集的方法。4.2. 设置2：跨数据集评估在这个实验中，我们研究了在一个数据分布中学习模型的影响，并对另一个数据分布进行了评估。这种情况更接近现实，因为几乎不可能使用从所有可用传感器，环境和个人获取的图像来训练模型。在此设置中，SARS-CoV-2 CT扫描数据集[14]仅用于训练/验证，测试集上不存在此数据集的图像对于测试集，我们使用参考文献[15]中提供的数据集COVID-CT，因为它是文献中几位作者使用的数据集我们遵循参考文献[15]中提出的协议将COVID-CT分为训练集和测试集，但是，我们强调，对于训练模型，仅使用来自SARS-CoV-2 CT扫描数据集的图像。我们还评估了其他测试配置，例如使用COVID-CT训练分区作为测试，并将COVID-CT数据集的两个分区组合为更大的测试集（见表7）。我们还测试了相反的场景，其中我们使用来自COVID-CT数据集的所有图像[15]进行训练，并使用SARS-CoV-2 CT扫描数据集的所有图像[14]进行测试。4.2.1. 结果可以看到，当我们将跨数据集评估与数据集内评估进行比较时，模型性能会大幅降低。我们认为，这种行为的原因是由于数据采集的多样性。来自不同数据集的图像可以通过不同的图8.第八条。所提出的方法的ROC曲线。设备、不同的图像传感器，并因此改变图像上的相关该模型可以学习如何识别一个图像中可能指示COVID-19存在（或不存在）的部分和模式，尽管这些模式可能不会出现在不同的数据集中。在COVID-CT [15]上的训练和在SARS-CoV-2 CT扫描数据集[14]中的测试显示出更差的结果，因为COVID-CT训练集较小。我们认为，此类测试应强制用于所有旨在通过CT图像识别COVID-19的方法，因为它是最能反映真实测试的方法。4.3. 设置3：输入分辨率在此设置中，我们评估的协议，在参考。[15]仅COVID-CT数据集。Zhao等人。[15]建议将COVID-CT数据集分为三组：训练，验证和测试。我们也应用数据增强通过旋转（最大值） 0.15公斤为每一侧），表9与文学的比较。# -使用不同的测试集进行评价：仅105张图像（47张COVID和58张非COVID）。接近加速F1AUC#Amyar等人[12] 86.0#Mobiny等人[10] 87.6 87.1Polsinelli等人[11] 83.0 83.3He等人[9] 86.0 85.0 94.0拟议办法架构2224X 22483.7477.5587.3682.16300X 30081.2879.5981.2580.41350X 35086.2181.6388.8985.10400X 40080.3074.4982.9578.49450X 45077.3475.5177.0876.29500X 50087.6879.5993.9886.19EfficientNet-B3 300X 30077.3469.3980.9574.72建筑1 224X 22479.3170.4184.1576.70P. Silva等人医学信息学解锁20（2020）1004278×见图9。输入为500X 500的架构2的训练损失曲线。随机缩放（80%的面积）的概率为20%，水平翻转的概率为50%。我们强调，数据增强仅适用于训练数据。最终的训练图像总数为2968张图像（1442张COVID和1408张非COVID）。使用参考文献中的协议。[15]，测试集由203张图像组成（98张COVID和105张非COVID）。4.3.1. 结果在表8中，我们报告了使用参考文献[15]中描述的方案的拟议方法的结果。可以观察到，与文献中可用的实验相比，在设置 1 和 2（EfficientNet-B3）中使用相同方法的实验具有更差的性能。为了减少“架构1”训练过程中过拟合的发生率，我们提出了一个更深的网络。在大多数情况下，当使用更深的网络（参见最好的模型是具有输入大小为500X 500的架构2的模型（可在https://github.com/ufopcsilab/EfficientCovidNet上获得源代码）。模型的ROC曲线见图。8.第八条。我们在表9中列出了最佳建议方法与文献中可用方法尽管Amyar等人[12]和Mobiny等人[10]提出了结果，但两人都仅使用105张图像（47张COVID和58张非COVID）评估了他们的方法，因此，无法直接与当前工作进行比较因此，以前在这种设置中获得的最佳结果在参考文献中给出[9]。尽管本文提出的工作在准确性和COVID-CT数据集上的F1得分方面克服了它，但使用了一个明显较小的模型（3个较小）。参考文献[9]提出的基本模型需要14，149，480个参数，而本文提出的模型仅需4，779，038个参数。的最佳模型的训练损失曲线可以在图中看到。9.第九条。5. 结论在这项工作中，提出了一种用于检测CT图像中COVID-19模式的模型，即EffiecintCovidNet，以及基于投票的方法和跨数据集分析。所提出的模型呈现出与最先进的方法相当的结果，并且在两个数据集上具有迄今为止此外，它是三倍小（与478万个参数，而He et al.[9]），并且具有0.010 s的延迟该模型可以在计算能力较低的设备上使用，例如智能手机和平板电脑，甚至可以促进与放射学PACS的集成。我们的模型在三个设置和两个最大的公共数据集，包括跨数据集分析。据我们所知，这是为目前的任务进行这种分析的第一项工作，我们认为这是我们工作的一个重大贡献。交叉数据集方法对于旨在检测CT图像中的COVID-19的方法至关重要，因为该方法类似于真实场景并揭示了方法的局限性（例如，在COVID-CT测试集的这种情况下，准确率从87.68%下降到56.16%）。我们的分析表明，旨在在CT图像中检测COVID-19的方法必须得到显着改进，才能被视为临床选择。所提出的基于投票的方法有利于检测假阳性和假阴性，从而有助于提高准确性。在这项研究中，我们展示了深度学习模型在CT图像上检测COVID-19的潜力。我们还强调，为了以更现实的方式评估这些方法，需要更大和更多样化的数据集。作为未来的研究路径，我们打算从几个巴西中心建立一个非常大的CT图像数据集，以尝试覆盖更大范围的设备（传感器），种族群体和采集过程，从而正确验证我们的方法。竞合利益作者声明，他们没有已知的可能影响本文所报告工作确认作者要感谢UFOP，UFPR，FAPEMIG ，CAPES 和CNPq（Grant#428333/2016作者还希望NVIDIA捐赠一个GPU Titan Black和两个GPU Titan X。引用[1] 艾T，杨Z，侯H，詹C，陈C，吕W，陶Q，孙Z，夏L。相关性中国2019冠状病毒病胸部ct和rt-pcr检测：1014例报告放射学2020：200642。[2] Ng M-Y，Lee EY，YangJ，Yang F，Li X，Wang H，Lui MM-s，Lo CS-Y，Leung B，Khong P-L，et al. 2019冠状病毒感染的影像学特征：影像学表现和文献综述。放射学：心胸成像2020;2（1）：e200034。[3] Hemdan EE-D，Shouman MA，Karar ME. Covidx-net：深度学习分类器框架，用于诊断X射线图像中的Covid-19。2020.第11055页。arXiv preprintarXiv：2003.[4] 放大图片作者：A. Covid-resnet：一个用于从射线照片中筛选covid 19的深度学习框架。2020年。p. 一四三九五 arXiv preprint arXiv：2003.[5] Li T，Han Z，Wei B，Zheng Y，Hong Y，CongJ.通过判别式成本敏感学习从胸部X射线中稳健筛查covid-19。2020年。p. 12592。 ArXiv abs/2004年。P. Silva等人医学信息学解锁20（2020）1004279[6] 放大图片作者：Abdelsamea M，Gaber M.使用detrac深度卷积神经网络对胸部X射线图像中的新冠肺炎进行分类。 medRXiv;2020 年。https://doi.org/10.1101/2020.03.30.20047456.[7] 王力，王A. Covid-net：一个定制的深度卷积神经网络设计，用于从胸部X光摄影图像中检测COVID-19病例。2020. arXiv预印本arXiv：2003.09871。[8] Luz E，Silva PL，Silva R，Silva L，Moreira G，Menotti D.为x射线图像中的covid-19模式检测建立有效和高效的深度学习模型。2020年。arXiv：2004.05717。[9] He X，Yang X，Zhang S，ZhaoJ，Zhang Y，Xing E，Xie P.基于ct扫描的covid-19诊断的样本高效深度学习。medR X iv; 2020年。[10] [11]李文，李文，李文.使用ct扫描和面向细节的胶囊网络进行放射科医生级别的covid-19检测。2020. arXiv预印本arXiv：2004.07407。[11] [10]杨文，李文. 一个光cnn用于检测covid-19从胸部ct扫描。2020年。p. 12837arXiv preprint arXiv：2004.[12] Amyar A，Modzelewski R，Ruan S.基于多任务深度学习的covid-19 ct成像分析：分类和分割。 medR X iv; 2020年。[13] 王S，康B，马J，曾X，肖M，郭J，蔡M，杨J，李Y，孟X，徐B. 使用ct图像筛选冠状病毒疾病（ covid-19 ）的深度学习算法。 medRX iv; 2020 年。https://doi.org/10.1101/2020.02.14.20023028网站。[14] Soares E，Angelov P，Biaso S，Froes MH，Abe DK. Sars-cov-2 ct扫描数据集：用于sars-cov-2识别的真实患者ct扫描的大型数据集。medR X iv; 2020年。[15] ZhaoJ，Zhang Y，He X，Xie P. Covid-ct-dataset：一个关于covid-19的ct扫描数据集。2020年。arXiv预印本arXiv：2003.13865。[16] 杨文，李文. Mobilenetv2：反向残差和线性瓶颈。在：IEEE计算机视觉和模式识别会议论文集; 2018年。第4510- 4520页。[17] Tan M，Le QV. Efficientnet：重新思考卷积神经网络的模型缩放。2019. arXiv预印本arXiv：1905.11946。[18] 放大图片作者：Luz E，Moreira G，Junior LAZ，Menotti D.针对视频监控的深眼周表示。 Pattern Lett 2018;114：2-12.[19] Ioffe S，Szegedy C.批量归一化：通过减少内部协变量偏移来加速深度网络训练。2015年。 arXiv预印本arXiv：1502.03167。[20] [10]李文辉，李文辉，李文辉. Dropout：防止神经网络过拟合的简单方法。JMach Learn Res 2014;15（1）：1929-58.[21] Ramachandran P，Zop

下载后可阅读完整内容，剩余1页未读，立即下载