没有合适的资源?快使用搜索试试~ 我知道了~
医学信息学解锁22(2021)100505EMCNet:使用卷积神经网络和机器学习分类器集成从X射线图像ProttoySaha *,Muhammad Sheikh Sadi,Md. 米隆·伊斯兰Khulna University of Engineering Technology,Khulna,9203,Bangladesh&A R T I C L EI N FO保留字:COVID-19卷积神经网络分类器的扩充自动诊断x射线图像A B S T R A C T最近,冠状病毒病(COVID-19)对医疗保健系统及全球整体经济造成严重影响。医生、研究人员和专家正在关注快速检测COVID-19的替代方法,例如开发自动COVID-19检测系统。本文提出了一种名为EMCNet的自动检测方案,通过评估胸部X射线图像来识别COVID-19患者。卷积神经网络专注于模型的简单性,以从感染COVID-19的患者的X射线图像中提取深层和高级特征。利用提取的特征,开发了二进制机器学习分类器(随机森林,支持向量机,决策树和AdaBoost)用于COVID-19的检测。最后,这些分类器与最近其他基于深度学习的系统相比该系统可通过即时检测和低假阴性率保持其对COVID-19自动检测的重要性。1. 介绍最近的冠状病毒由严重急性呼吸综合征冠状病毒2(SARS-CoV-2)[1]引起,于2020年1月首次在中国武汉发现[2]。世界卫生组织(WHO)于2020年2月将其命名为COVID-19 [3]。最初,虽然它不被认为是一个严重的情况下,感染和快速死亡率的人现在已经崩溃了世界的医疗保健系统。世界卫生组织于2020年1月30日宣布这一流行为国际关注的突发公共卫生事件[4]。自2020年8月30日以来,全球共报告了25,297,383例冠状病毒病例,6,825,774例活动病例和848,561例死亡[5]。来自发达国家(中国、美国、意大利等)对于不发达国家来说,尽管设施短缺,医疗系统不足,诊断方法不当,但所有国家都在与这种严重的流行病作斗争。感染COVID-19的症状是发烧、咳嗽和严重的呼吸道问题[6]。检测COVID-19最常用的测试之一是真实的-时间逆转录聚合酶链反应(rRT-PCR)[7]。 该检测通过逆转录获得DNA,然后使用PCR扩增DNA进行分析。因此,它只能检测COVID-19作为这种病毒,RNA [8]。然而,该测试有几个局限性。它需要从 几个小时到两天的时间来检测新冠肺炎。此外,检测试剂盒并不广泛可用。它也不是很可靠[9],因为它可以提供假阴性结果,这意味着它可以将COVID-19患者错误分类为未感染。因此,医疗保健系统和医生在抗击这种流行病方面面临着重大问题。鉴于病毒的传染性,它正在迅速传播。许多国家已经要求人们呆在家里,并宣布整个地区处于“封锁”状态,以降低传播速度,并在缺乏呼吸机、ICU和疫苗的情况下预防疫情[ 10 ]。然而,RT-PCR和检疫不足以防止这种疫情,因此研究人员正在努力开发替代方案。他们专注于诊断COVID-19的放射图像分析[11]。CT扫描或胸部放射学图像分析在这种情况下可以发挥重要作用。研究人员发现,COVID-19感染的胸部X光或CT图像具有一些明显的特征,如毛玻璃阴影或模糊的黑点,这有助于检测COVID-19 [12]。放射科医生可以分析这些图像,帮助医生早期发现COVID-19。然而,在大流行病中,我们需要一个更新、可用和快速的系统。图像的手动分析可能是一个耗时的过程;* 通讯作者。电子邮件地址:prottoy@cse.kuet.ac.bd(P. Saha),sadi@cse.kuet.ac.bd(M.S. Sadi),milonislam@cse.kuet.ac.bd(Md.M. 伊斯兰教)。https://doi.org/10.1016/j.imu.2020.100505接收日期:2020年9月3日;接收日期:2020年12月15日;接受日期:2020年12月15日2020年12月22日在线提供2352-9148/©2020的 作者。发表通过 Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)中找到。可在ScienceDirect上获得目录列表医学信息学期刊主页:http://www.elsevier.com/locate/imuP. Saha等人医学信息学解锁22(2021)1005052在COVID-19的快速传播情况中,“时间“参数至关重要。更先进的,更先进的,自动)COVID-19检测系统用于诊断,以减少放射科医生服务的过度压力。在医疗系统中,深度学习打开了一扇新的大门[13]。随着深度神经网络的贡献,医疗保健系统在自动疾病检测方面取得了巨大进步,例如胸部疾病检测[14],癌细胞检测[15],肿瘤检测[16]和基因组序列分析[17]。Kieu等人。[18]提出了一种基于深度学习的模型来检测胸部X射线图像的异常密度。该系统使用三种CNN模型(CNN-该数据集包括400张胸部X射线图像,其中300张训练图像和100张测试图像。图像标记为0表示正常,1表示异常。大量实验表明,该系统的准确率达96%许多研究人员目前正在努力建立一个基于深度神经网络的自动COVID-19检测系统[19]。他们开发了几种深度神经网络模型,用于从COVID-19感染的胸部X光图像中提取特征,从而确保良好的准确性,灵敏度和特异性。由于缺乏COVID-19图像来源,他们中的大多数人都在一个小数据集上训练了他们的模型。因此,这些研究需要进一步加强与适当的培训和测试模型的实时使用。在这项研究中,提出了一个名为EMCNet的新系统,旨在通过使用胸部X光图像检测COVID-19。该系统构建了一个由20层组成的卷积神经网络(CNN)。与预训练模型相比,该模型结构简单。CNN从X射线图像中提取独特而独特的特征。随后,机器学习(ML)模型 被 训 练 以 使 用 这 些 特 征 向 量 开 发 二 元 分 类 器 ( COVID-19 vs.Normal)。最后,所有这些模型相结合,以开发一个更好的决策比任何个人分类器的分类器的投票集成。本文的主要贡献如下:i) 该论文提出了一种简单的CNN模型,可以从胸部X光图像中提取深度特征来检测COVID- 19患者。ii) 对于分类,开发了分类器的集合。 可以选择任何一个ML模型进行分类。然而,单个模型在一个测试集上表现出优异的性能,并不能保证它总是为所有其他测试集提供更好的结果。不同的模型可以为不同的数据集显示不同的结果。因此,将四个ML分类器组合在一起,以开发一个分类器集合,从而确保各种大小和分辨率的数据集都能获得iii) 这些模型使用1320张图像的数据集进行了训练和测试,最近开发的系统使用相对较小的COVID-19数据集进行了研究。iv) 该模型表现出优异的性能,98.91%的准确率,100%的精确度,97.82%的召回率,和98.89%的F1分数。其余文件概述如下。第2节介绍了使用深度学习网络从CT扫描或胸部X射线放射学图像中检测COVID-19的最新研究。第3节提供了数据集、数据预处理、EMCNet的建议模型及其结构的完整描述。第4节提供了EMCNet在评估指标方面的性能分析,以及EMCNet与现有系统的比较评估。最后,第五部分对本文进行了总结。2. 相关工作自COVID-19爆发以来,研究人员一直在努力寻找使用ML或深度神经网络的自动COVID-19检测系统。在本节中,最近的研究涉及基于深度神经网络的COVID-19检测和ML分类器被描述。表1是最近研究的比较研究。Abbas等人[20]提出了一种基于胸部X射线图像的新的深度CNN模型DeTraC。该系统通过应用类分解层简化了数据集的局部结构。随后,使用预训练的ResNet模型进行系统的训练。最后,类组成层用于微调最终分类。该数据集包括105张COVID-19的胸部X射线图像,11张SARS病毒疾病的图像和80张正常胸部X射线图像。该系统的准确性、敏感性和特异性分别为95.12%、97.91%和91.87%。Loey等人[21]提出了一种带有深度神经网络的生成对抗网络。数据集包括69张COVID-19胸部X射线图像、79张肺炎细菌感染的X射线图像、79张肺炎病毒感染的X射线图像和79张正常胸部X射线图像。该研究使用预先训练的模型进行。在这些模型中,Googlenet对四个类别的分类准确率达到80.6%。Alexnet在三类场景中获得了85.2%的准确率,Googlenet在两类场景中获得了100%的准确率。Rahimzadeh等人[22]开发了几种用于COVID-19自动分类的深度神经网络。用于系统的预训练模型是Xception和ResNet50V2。该数据集包括180张COVID-19患者的X射线图像,6054 的图像 肺炎患者,8851例正常患者的图像抗肿瘤实验表明,91.4%的所有类别的平均精度。Oh等人。[23]提出了一种基于补丁的CNN,具有相对少量的可训练参数。该系统选择的最终分类决定多数表决的结果在不同的路径位置。该数据集由15,043张图像组成,包括180张COVID-19病例图像,6012张肺炎图像和8851张正常患者图像。扩展实验的准确率为88.9%,精确率为83.4%,召回率为85.9%,F1得分为84.4%。Zhang等人[24]提出基于胸部X射线图像的新的基于深度学习的模型(异常检测模型)。该系统由三个模块组成:主干网络,用于提取胸部X射线图像的高级特征;分类头,用于生成分类分数;以及异常检测头,用于生成标量异常分数。该数据集包括100张COVID-19的胸部X光图像和1431张肺炎病例的图像。该系统的敏感性为96%,特异性为70.65%。Apostolopoulos等人[25]介绍了几种用于COVID-19检测的预训练CNN模型。该系统使用迁移学习来诊断相对较小的COVID-19数据集。该实验使用两个数据集进行。第一个数据集包含1427张X射线图像,其中包括224例COVID-19感染病例,700例细菌性肺炎病例和504例正常病例。第二个数据集包含224张COVID-19 X射线图像,700张细菌和病毒性肺炎图像,正常病例504在预先训练的模型中,MobileNetV2第 二 个 数 据 集 的 准 确 性 为 96.78% , 灵 敏 度 为 98.66% , 特 异 性 为96.46%。Mahmud等人[26]提出了一种新的深度学习模型,名为CovXNet,使用胸部X射线图像自动检测COVID-19和其他肺炎病例。该系统引入深度卷积从胸部X射线图像中提取高级特征。首先,他们用正常和(病毒/细菌)肺炎胸部X射线图像训练他们的模型。这一步的学习被转移到其他层,并使用COVID-19胸部X射线图像和肺炎病例进行训练。该系统使用了叠加算法和基于梯度的判别定位。数据集包括305张COVID-19病例图像、1493张病毒性肺炎图像、2780张细菌性肺炎图像和1583张正常患者图像。Ex实验显示COVID-19与正常病例的准确性为97.4%,COVID-19、正常以及病毒性和细菌性肺炎病例分类的准确性为90.2%。Tsiknakis等人。[27]开发了一种基于深度学习的模型,用于从胸部X射线图像诊断COVID-19。引入预训练模型Inception-V3,并结合迁移学习,以应对COVID-19P. Saha等人医学信息学解锁22(2021)1005053×表1COVID-19检测和ML分类器集成相关最新研究的比较研究作者数据集来源数据集详细信息模型Encovery准确性(%)Abbas等人[20] COVID-19和SARS图像:[31];正常图像[32,33]:196(COVID-19= 105,Normal= 80,SARS= 11)ResNet No 95.12%Loey等人[21] COVID-19图像:[31];正常和306(COVID-19= 69,正常=79,细菌Googlenet编号80.56Rahimzadeh等人[22]肺炎图像[34]:COVID-19图像:[31];正常和肺炎图像[35]:肺炎=79,病毒性肺炎=79)15,085(COVID-19= 180,正常=8851,肺炎=6054)Xception+ResNet50V2否91.4Oh等人[23] COVID-19图像:[31];正常和肺炎图像[36]:15,043(COVID-19= 180,正常=8851,肺炎=6012)基于补丁的CNN No 88.9Zhang等人[24] COVID-19和图像:[31];正常图像[37]:1531(COVID-19= 100,Normal= 1431)18层剩余CNN No 72.31%Apostolopoulos等人[25日]COVID-19图像:[31,38];正常和肺炎图像[34]:1442(COVID-19= 224,正常=504,肺炎=714)MobileNetV2 No 96.78Mahmud等人[26] 2019冠状病毒病图片:锡尔赫特医学院,BD;正常和肺炎图像[39]:6161(COVID-19= 305,正常=1583,细菌性肺炎=2780,病毒性肺炎=1493)卷积神经网络(CNN)没有90.2Tsiknakis等人[27] COVID-19图像:[31];正常和肺炎图像[34,35]:Sethy等人[28] COVID-19图像:[31,38];正常和肺炎图像[34]:Horry等人[29] COVID-19图像:[31];正常和肺炎图像[37]:572(COVID-19= 122,正常=150,细菌性肺炎=150,病毒性肺炎=150)381(COVID-19= 127,正常=127,细菌性肺炎=63,病毒性肺炎=64)60,838(COVID-19= 115,正常=60,361,肺炎=322)InceptionV3 No 76Resnet50+SVM否95.33VGG19 No 81Hasan等人[30][40] 768(糖尿病=268,非糖尿病=500)KNN,DT,RF,朴素贝叶斯,AB,XB是72.26数据集。该数据集包括122张COVID-19图像、150张细菌性肺炎图像、150张病毒性肺炎图像和150张正常病例图像。该系统对COVID-19与普通肺炎二元分类的准确性为100%,灵敏度为99%,特异性为100%,对四类分类的准确性为76%,灵敏度为93%,特异性为87%Sethy等人[28]提出了一种系统,其中九个不同的预训练模型从胸部X射线图像中提取特征。该系统使用SVM来使用提取的特征对COVID-19进行共381个胸部X射线图像被用作实验的数据集。在所有的 模 型 中 , ResNet50 被 认 为 是 最 好 的 特 征 提 取 。 该 系 统 使 用ResNet50和SVM获得了95.33%的准确率和95.34%的F1得分Horry等人[29]介绍了一种使用四种不同预训练模型的方案。该数据集包含115个COVID-19样本、322个肺炎病例和60,361个健康病例样本。在这些模型中,VGG16和VGG19表现最好。VGG 19对COVID-19与肺炎分类的准确率达到81%。Hasan等人[30]开发了一种新的基于ML分类器的集成模型该系统提出了六个ML模型:k-最近邻,决策树,随机森林,AdaBoost,Naive Bayes和XGBoost。系统采用加权集成。根据ML的ROC曲线下面积计算权重模型 该系统对268名糖尿病患者进行了实验,500名非糖尿病患者。该系统的敏感性为78.9%,特异性为93.4%3. 方法为了开发一个名为EMC- Net的自动COVID-19检测系统,我们从多个来源收集了数据。然后对收集到的图像调整大小。对数据集进行数据归一化,以防止过拟合并促进泛化。将数据集分成三个不同的集:训练集、验证集和测试集。利用训练集和验证集,对所提出的CNN模型进行了训练。实验运行到不同的时期,例如50、60和100。在运行网络50个epoch之后,网络精度开始饱和。在50个epoch的情况下,该模型达到了预期的训练精度和验证精度。选择模型的第一个全连接层(FCL)进行特征提取。利用该层从每幅训练图像中提取特征向量。所有这些图像的特征向量被送入四个ML分类器。为了调整ML分类器的最佳超参数,网格搜索技术应用于每个ML分类器。最后,所有ML分类器都是结合开发一个分类器的集成,该集成基于ML分类器的多数投票来预测类标签。从混淆矩阵、查准率、查全率和F1分数等方面对系统的性能进行了评价。EMC- Net的整体系统架构在图中突出显示。1.一、3.1. 数据集描述在拟议的EMCNet中,从多个来源收集数据集。首先,从Cohen等人开发的Github存储库中收集了660张阳性COVID-19胸部X射线图像[31]。该数据库包含COVID-19阳性、COVID-19阴性和肺炎病例的X射线图像。这个仓库的图像是从公开来源和医院收集的虽然所有患者的完整元数据没有在源文件中描述,但感染患者的平均年龄约为55岁。在进行实验时,科恩数据库包含500张阳性COVID-19感染患者的胸部X光图像阴性COVID-19 图像包括其他病毒性和细菌性肺炎(MERS,SARS和ARDS)。拟议的拟议的系统没有考虑其他病毒性和细菌性肺炎疾病。因此,没有使用该储存库中的负面图像从这里只选择了500张COVID-19病例的阳性图像从另一个Github来源[41]、SIRM数据库[42]、TCIA [43]、radiopaedia.org[44]和Mendeley [45]共收集了1800张COVID-19胸部X射线图像。从这些来源共收集了2300张COVID-19 X射线图像。从Kaggle数据库[46]和NIH胸部X射线图像中获得正常胸部X射线图像[47]. 从这个来源,2300个正常胸部X线图像,收集。样品如图2所示。因此,所提出的EMCNet的数据集总共包含4600张图像。将数据集分为70%:20%:10%三个不同的集:3220张图像的训练集,920张图像的验证集和460张图像的测试集。将数据集划分为训练集、验证集和测试集,如表2所示。3.2. 数据预处理所有样本图像大小不同。因此,将图像的大小调整为224 224像素。为了更好地学习系统,进行了数据归一化。因此,数据集可以被输入CNN网络并训练模型。P. Saha等人医学信息学解锁22(2021)1005054××Fig. 1. EMCNet的体系结构图二、 第一行的前三张图像是COVID-19 X射线图像的样本。其余图像为正常胸部X射线图像。3.3. 开发拟议的EMCNet有几种基于 深度迁移学习的架 构用于从图像中提取 特征,如AlexNet,VGG 16,Inception和ResNet-50。ResNet-50是一个50层的剩余网络,层与层之间ResNet-50第一层是卷积层,过滤器大小为77和步幅2.第二层是最大池化层,过滤器大小为3 3,步幅为2。然后开始网络的第一阶段。它由三个剩余块组成,每个剩余块包含三个层。在块1、64、64和256的所有三个层中在残差块中,以步幅2执行卷积。因此,图像的高度和宽度是P. Saha等人医学信息学解锁22(2021)1005055×(×)2表2将数据集划分为训练集、验证集和测试集。数据集COVID-19正常总培训161016103220验证460460920测试230230460总230023004600从一级到另一级减少到一半,但沟道宽度加倍。另一个预训练模型VGG-16有六个阶段。在前两个阶段中,有两个卷积层,其中一个最大池化层的步幅为2。在接下来的三个阶段中,有三个卷积层,其中一个最大池化层的步幅为2。最后一级有三个FCL。卷积层使用大小为3 3的滤波器和步长为1。过滤器的数量从64开始,在除第5级之外的每一级中加倍迁移学习是获取预训练模型的权重并使用先前学习的特征来决定新类别标签的方法。在迁移学习中使用了一个网络,该网络在imagenet数据集中进行了预训练,该网络学习识别初始层中图像的高级特征。对于迁移学习,在预训练网络的末尾添加了一些密集层。然后,网络学习哪些特征组合将有助于识别新数据集合中的特征。在EMCNet中,CNN模型的灵感来自预训练模型VGG-16,优先考虑模型的简单性。在提出的CNN中,每个阶段最多考虑两个卷积层,并添加了dropout层以防止模型的过拟合。为了开发EMCNet,CNN模型用于提取每个训练图像的特征。然后将特征集传递给ML分类器来训练它们。最后,所有这些模型相结合,开发一个集成的分类器。详细说明如下。3.3.1. 提出的CNN架构这个过滤器可以被称为“特征标识符”。” 加入的卷积层越多,模型越能从图像中提取深层特征;因此,模型可以确定图像的完整特征。在模型中逐步添加了更多的卷积层。滤波器对图像的子区域执行卷积运算。卷积运算意味着与图像的滤波器值和像素值的逐元素乘法和求和。过滤器的值被称为权重或参数。这些权重必须通过训练模型来学习。图像的子区域被命名为“感受野”。” 然后,它在整个图像上连续移动一定量的单位,并执行卷积,直到覆盖整个图像。一个操作输出一个值。整个图像的卷积输出值的数组或度量。操作如(1)所示。C=I*F=∑ ∑I(i+m,j+n)F(fh,fw)(1)其中I是输入,F是大小为fh fw的滤波器。运算由运算符(*)表示。滤波器的移动量由另一个称为stride的参数确定。对于模型,对于所有卷积层,步幅被设置为1。步幅增加越多,输入音量的空间维度(高度和宽度)减小越多。对于感受野的最小重叠的高步幅值会产生一些问题,例如感受野可能超出输入体积并且维度可能降低。为了克服这些问题,使用填充。“零填充“(也称为“相同“填充)在边界周围用零填充输入,并保持输出体积尺寸与输入尺寸相同。如果步幅大小为1,则零填充的大小由(2)确定。ZeroPadding=f-1( 2)拟议的EMCNet开发了一个简单的CNN网络来提取特征。一般来说,CNN有三个不同的层:卷积层、池化层和FCL。所提出的模型的层类型及其解释如表3所示。为了训练模型,将RGB图像(大小为224× 224× 3)输入CNN模型。这里,输入图像中的通道数(nc第一层是卷积层。这一层采用过滤器,也称为通常,滤波器高度(fh)和宽度(fw)保持不变。其中f是过滤器的高度或宽度;这里,高度和宽度的大小相等。对于所提出的EMCNet,使用“有效填充“而不是零填充,因此输出维度与输入维度不相同,并且在卷积后收缩。卷积层中的多个滤波器已被用于提取多个特征。在第一层中,使用32个过滤器过滤器的数量在接下来的层中逐渐增加,从32到128,128到512,等等。输出的卷被称为“激活图”或“特征图”。所有层的输出形状如表4所示。的表3CNN层及其详细说明。层过滤器大小池大小步幅填充过滤器数量丢弃阈值激活Conv 2D 3×3Conv 2D3 × 3- 1有效128 - Relu MaxPooling 2D- 2 × 2 2-丢弃- .25 -Conv 2D 3 × 3 - 1有效64 - Relu MaxPooling 2D- 2 × 2 2-––-辍学-––––.25–3× 3-1有效128-Relu MaxPooling2D-2 × 22-––-辍学-––––.25–3× 3-1有效512-Relu MaxPooling2D-2 × 22-––-辍学-––––.25–3× 3-1有效512-Relu MaxPooling2D-2 × 22-––-辍学-––––.25压扁FCL辍学FCLP. Saha等人医学信息学解锁22(2021)1005056××)S1==1- = 2×表4提出的CNN模型的模型摘要128]模型,该层采用大小为2 2的过滤器,其步幅等于2。 滤波器围绕输入体积进行卷积,并输出感受野的最大值。使用此层的观察结果是,特定功能相对于其他功能的相对位置比其确切位置更重要。它防止了过拟合,减少了权重的数量,从而降低了计算成本。然后使用dropout层。这一层通过将它们设置为零来随机丢弃一些激活。该层确保模型可以预测图像的实际类别标签,尽管一些激活被丢弃。因此,模型不应过于拟合5 conv2d_8(Conv2D)[108,108,64] 73,792来训练数据集dropout层有助于防止过拟合。辍学6 max_pooling2d_6[54、54、64] 0层已经以0.25的阈值被应用所述展平层(MaxPooling2D)7 dropout_7(辍学)[54,54,64] 08 conv2d_9(Conv2D)[52,52,128] 73,8569将2D特征图转换为1D特征向量,并将其馈送到整箱货。迄今为止,已经提取了图像的深层特征使用FCL,COVID-19的分类任务是从1D长特征执行的max_pooling2d_7(MaxPooling2D)dropout_10(脱落)17[26、26、128] 0vector.在提出的CNN中,FCL由64个神经元组成。第一FCL将输出激活传递给第二FCL。最后,在输出层,模型通过“softmax“激活预测COVID-19与正常病例之间的类别标签。所提出的CNN架构如图所示。3.第三章。3.3.2. ML和集成技术从CNN的第一个FCL中提取特征。从表4中,第一个FCL是因此,特征向量的维度为从每个训练图像中提取深度特征,因此每个图像有64个特征。训练集包含3220幅图像,训练ML分类器的新输入集维数为(3220× 64)。输入数据被传递到ML输出体积的大小由(3)、(4)和(5)确定。Ih-fh +2P模型来训练它们。网格搜索算法被用来调整ML分类器的应用了五重交叉验证Oh=S+1(3)来学习最好的分类器。ML分类器被组合以开发分类器的集合分类器的集合-Ow=Iw-fw+2P+1(4)n=Nf(5)其中Ih是输入高度,Iw是输入宽度,fh是过滤器高度,fw是过滤器宽度,S是步幅大小,P是填充,Nf是过滤器的数量。对于我们的第一个卷积层。Ih=224,Iw=224,fh=3,fw=3,S=1,P=0和Nf=32。根据(3)、(4)和(5),可以获得以下值。224- 3+ 0将来自四个不同ML分类器模型的结果进行组合,并使用基于多数投票的类别标签的最终决定。它有助于提高性能,并表现出比任何单一分类器更好的性能。对于集成,应用“硬投票”技术,其中分类器使用基于来自其他模型的最大投票总和的决策。ML分类器的训练阶段如图所示。四、3.4. 绩效评估对于EMCNet的性能评估Oh=1+1=222论文的准确率,精密度,召回率和F1得分。用于导出这些度量的值的公式在(7)、(8)、(9)和(10)中示出。Ow=224-3+0+1=222On=32非线性激活应用于卷积输出。卷积层已执行线性计算(逐元素乘法),准确度TP+TNTP+FP+TN+FN精度TPTP+FPTP(七)(八)阳离子和总和)。因此,在具有该激活的线性操作上引入了非线性。激活ReLU(整流线性单元)是回忆=TP+FN(9)应用于卷积输出。ReLU操作的函数如(6)所示。精确 度×召回率精确度+召回率(十)ReLU(X)=max(0,X)(6)这里,X是卷积运算的输出。ReLU将所有负输出减少为零。在所提出的模型中,使用ReLU的动机是它增强了模型的非线性,并有助于在不影响模型准确性的情况下加快计算时间。它还减少了梯度消失的问题,其中较低层的训练非常缓慢。在两个卷积层之后,使用maxpooling层。该层减少了输入的空间维度(高度和宽度)。拟议层数层(类型)输出形状参数1conv2d_6(Conv2D)[222,222,32]8962Conv2d_7 Conv2D)[220,220,36,9923max_pooling2d_5128][110,110,04(MaxPooling2D)dropout_6(脱落)128][110,110,010dropout_8(脱落)[26,26,128]011Conv2d_10(Conv2D)[24,24,512]590,33612max_pooling2d_8[12,12,512]013(MaxPooling2D)dropout_9(脱落)[12,12,512]014Conv2d_11(Conv2D)[10,10,512]2,359,80815max_pooling2d_9[5,5,512]0(MaxPooling2D)16[5,5,512]0_1(展平)[12,800人]018 dense_2(密集)[64个]819,26419例脱落_11例(脱落)[64个]020 dense_3(密集)[二]《中国日报》65P. Saha等人医学信息学解锁22(2021)1005057在上述等式中,TP表示“真阳性“,代表系统成功预测COVID-19病例的实际类别标签。TN表示“真阴性“,其描述了系统对正常情况的实际类别标签的成功预测。FP的意思是“假阳性“,这表明模型将正常病例错误地分类为COVID-19,但他们实际上不是COVID-19感染者。FN代表“假阴性“,这表明该模型将COVID-19病例错误分类为正常。P. Saha等人医学信息学解锁22(2021)1005058图三. CNN架构。4. 实验分析图四、 ML分类器的训练过程和分类器的集成。4.1. 实验装置EMCNet使用CNN从图像中提取特征,并使用四种不同的ML分类器对COVID-19进行分类。CNN模型被训练了多达50个epoch。ML分类器的超参数采用网格搜索技术进行调整。在混淆矩阵、ROC曲线、精确度、召回率、准确度和F1分数方面分析了所提出的CNN、ML分类器和分类器集成对每个类别标签的性能。该实验在Google合作实验室进行。Google Collabo是一个基于笔记本的云服务,用于传播机器学习方面的知识和工作。它提供了一个完全优化的运行时,用于深度学习和免费访问稳定的GPU。4.2. 结果分析图5示出了关于时期的训练准确度和验证准确度。CNN模型运行了50个时期。的P. Saha等人医学信息学解锁22(2021)1005059==图五、EMCNet中使用的CNN的性能分析。(a)训练和验证准确性(b)训练和验证损失。最大训练准确率为99.97%,最大验证准确率为98.33%。这些值表明我们的模型学习效果良好,可以正确地将COVID-19与正常病例进行分类。训练损失为0.0021,验证损失为0.0958。利用提取的特征,训练了四个ML分类器。网格搜索技术被用来调整超参数。调整后的模型超参数为评估该模型,考虑了几个性能指标以有效诊断COVID-19。图6描述了具有从CNN到分类器集合的SIX个分类器的EMCNet的混淆矩阵。在测试集中,有230张COVID-19图像和230张正常X射线图像。在混淆矩阵中,实际病例沿行放置,预测病例沿列放置。对于CNN,在230例COVID-19病例中,该模型检测到222例病例,并将8例病例错误分类为正常。该模型预测了所有正常病例的确切类别标签。对于RF(其中提取的特征用于学习模型),该模型检测到221例病例,并将230例COVID-19病例中的9例误分类为正常。DT预测了220例COVID-19病例的确切分类标签,并将10例病例错误分类为正常。 AB预测了222例COVID-19病例的确切分类标签,并将8例病例错误分类为正常。 所有这三个模型都预测了所有正常情况下的确切类别标签。对于SVM,在230例COVID-19病例中,该模型检测到223例病例,并将7例病例错误分类为正常。在正常病例中,该模型检测到221例病例,并将9例病例错误分类为COVID-19阳性。最后,我们的分类器集合,它使用基于多数的决定,四个ML分类器的投票,分类225 COVID-19病例和230正常病例。每个类别的分类器(COVID-19与正常)在表6中示出,并且它们的图形视图在图7中呈现。CNN模型对COVID-19类别实现了100%的精确度、96.52%的召回率、96.52%的准确度和98.23%的F1得分,对正常类别实现了96.64%的精确度、100%的召回率、100%的准确度和98.29%的F1得分。DT模型对COVID-19病例达到100%的精确度、95.65%的召回率、95.65%的准确度和97.78%的F1评分,对正常病例达到95.83%的精确度、100%的召回率、100%的准确度和97.87%的F1评分。RF模型对COVID-19病例达到100%的精确度、96.09%的召回率、96.09%的准确度和98%的F1评分,对正常病例达到96.23%的精确度、100%的召回率、100%的准确度和98.08%的F1评分。SVM模型对COVID-19病例的精确度、召回率、准确度和F1得分分别达到96.12%、96.96%、96.96%和96.54%,对正常病例的精确度、召回率、准确度和F1得分分别达到96.93%、96.09%、96.09%和96.51%。 AB模型实现了100%的准确率,96.52%的召回率,96.52%的准确率,98.23%的F1评分与COVID-19病例和96.64%的精确度,100%回忆率100%,准确率100%,F1评分98.29%。最后,所提出的分类器集成返回100% 的精确度,97.83%的召回率, 97.83%的准确率和98.90%的F1分数与COVID-19病例和97.87%的精确度,100%的召回率,100%的准确率和98.92%的F1分数与正常病例。绘制ROC曲线,其中真阳性率(TPR)沿X轴,假阳性率(FPR)沿y轴。用于获得TPR和FPR的公式示于(11)和(12)中。TPR中文( 简体)TP+FN评估矩阵的精确度,召回率,准确率和F1得分FPRFPTN+FP(十二)表5调整ML分类器的超参数。ML分类器超参数随机森林Bootstrap:True(采样方法-有或没有替换)最大深度:100(决策树的最大层数)最大特征数:2(分割的最大特征数)最小样本叶:4(叶节点中允许的最小数据)最小样本分割:10(分割允许的最小数据)ROC曲线下面积(AUC)越高,则认为模型对医学诊断越有效。我们的分类器的ROC曲线绘制在图8中。对于CNN,AUC为0.9832。对于RF,AUC为0.9812。对于DT,AUC为0.9792。对于SVM,AUC为0.9653。对于AB,AUC为0.9832。最后,分类器的集合实现了0.9894的AUC。因此,该模型可以有效地从胸部X射线图像中检测COVID-19病例。整个系统的精确度,召回率支持向量机决策树AdaBoostn估计量:100(树的数量)C:1(正则化参数)内核:rbf(指定内核类型-'linear','poly','rbf','sigmoid')Gamma:0.1(“rbf”、“poly”和“sigmoid”的核系数。)最大叶节点:10最小样本分割: 4标准:熵最大深度:6n_estimators:250分类器示于表7中。如上表所示,CNN在COVID-19自动诊断方面实现了100%的准确率、96.52%的召回率、98.26%的准确率和98.22%的F1评分。对于RF模型,精确率为100%,召回率为96.09%,准确率为98.04%,F1评分为98%。对于DT模型,精确率为100%,召回率为95.65%,准确率为97.82%,F1评分为97.77%。对于SVM模型,精确率为96.12%,召回率为96.96%,准确率为96.52%,F1评分为96.54%。对于AB模型,精确率为100%,召回率为96.52%,P. Saha等人医学信息学解锁22(2021)10050510图六、 用于EMCNet(a)CNN(b)RF(c)DT(d)AB(e)SVM(f)分类器的Enclusion中的分类器的混淆矩阵表示。P. Sah
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- JavaScript实现的高效pomodoro时钟教程
- CMake 3.25.3版本发布:程序员必备构建工具
- 直流无刷电机控制技术项目源码集合
- Ak Kamal电子安全客户端加载器-CRX插件介绍
- 揭露流氓软件:月息背后的秘密
- 京东自动抢购茅台脚本指南:如何设置eid与fp参数
- 动态格式化Matlab轴刻度标签 - ticklabelformat实用教程
- DSTUHack2021后端接口与Go语言实现解析
- CMake 3.25.2版本Linux软件包发布
- Node.js网络数据抓取技术深入解析
- QRSorteios-crx扩展:优化税务文件扫描流程
- 掌握JavaScript中的算法技巧
- Rails+React打造MF员工租房解决方案
- Utsanjan:自学成才的UI/UX设计师与技术博客作者
- CMake 3.25.2版本发布,支持Windows x86_64架构
- AR_RENTAL平台:HTML技术在增强现实领域的应用
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功