没有合适的资源?快使用搜索试试~ 我知道了~
医学信息学解锁23(2021)100551使用AlexNet和支持向量机阿迪提五世 Vedalankar a,b,*,Shankar S. 作者:Gupta b,Ramchandra R.曼塔尔卡尔湾a印度马哈拉施特拉邦,431605,南德,圣雄甘地教会工程学院,电子和电信系b印度马哈拉施特拉邦,431606,南德,Gobind Singhji工程技术学院,电子和电信系A R T I C L EI N FO关键词:乳腺X线片结构性畸变卷积神经网络AlexNet支持向量机A B S T R A C T目的:探讨乳腺结构变形(AD)这一乳腺实质形态的不规则性。AD的性质非常复杂;尽管如此,这项研究仍然非常必要,因为AD被视为乳腺癌的原始体征。在这项研究中,开发了一种新的基于卷积神经网络(CNN)的系统,可以对AD失真的乳房X线照片和其他乳房X线照片进行分类方法:在第一部分中,对乳腺X线照片进行预处理和图像增强技术。在另一半,学习和手工制作的功能被检索。AlexNet预训练CNN用于提取学习特征。支持向量机(SVM)验证了AD的存在。为了改进分类,该方案在各种条件下进行测试结果:开发了一个复杂的基于CNN的系统,用于AD的逐步分析。最高准确度、敏感度和特异度分别为92%、81.50%和90.83%。结果优于传统方法。结论:基于整体研究,建议CNN预训练网络和支持向量机的组合是识别AD的一个很好的选择。这项研究将激励研究人员找到高性能的改进方法此外,它还将帮助放射科医生。意义:AD可以在任何异常生长之前长达两年发展。该系统将在乳腺癌早期表现的检测中发挥重要作用。该系统将帮助社会为世界各地的妇女提供更好的治疗选择,并降低死亡率。1. 介绍世界卫生组织(WHO)报告称,乳腺癌每年对全球约210万女性构成威胁[1]。2018年有62.7万名女性死于乳腺癌。Globocan(全球癌症观察组织-世卫组织)2018年印度汇总统计数据报告称,有162,468例新记录的乳腺癌病例。每两个新诊断的妇女中,就有一个失去了生命。87,090名女性的死亡导致乳腺癌在印度排名第一。此外,每28名女性中就有一名患有乳腺癌[2]。乳腺癌是一种在乳腺细胞中发展的癌症。乳腺癌细胞通常会导致肿瘤,通常可以在X射线上观察到。增加乳腺癌威胁的主要因素是缺乏筛查、乳腺致密、缺乏认识、晚期更年期、初潮早、家庭背景和生活现代化。乳房X光检查是一种简单、低成本和非穿透性的检查方式,用于获得低剂量的乳房X光检查。如果计算机辅助检测(CAD)工具可以在早期阶段预测乳腺癌最常见的异常,如肿块和微钙化,可以通过形状和对比度来捕获。第三个普遍的发现,即结构变形(AD)是乳腺癌的原始症状[3]。AD的存在被发现有或没有其他类型的放射学特征,如肿块,双侧不对称或微钙化。广告与背景的对比度很低. 此外,AD检测的有效性随着乳房组织的密度而恶化AD的复杂性对专家来说是一项艰巨的任务,被忽视的威胁虽然主要的研究已经完成,* 通讯作者。电子和电信系,圣雄甘地使命的工程学院,南德,431605,马哈拉施特拉邦,印度。电子邮件地址:vedalankar_av@mgmcen.ac.in(A.V.Vedalankar)。https://doi.org/10.1016/j.imu.2021.100551接收日期:2021年2月2日;接收日期:2021年3月11日;接受日期:2021年3月11日2021年3月17日网上发售2352-9148/©2021的 作者。发表通过 Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)中找到。可在ScienceDirect上获得目录列表医学信息学期刊主页:http://www.elsevier.com/locate/imuVedalankar等人医学信息学解锁23(2021)1005512图1.一、 用于AD和非AD乳腺X线照片分类的端到端架构。在肿块和微钙化的检测面积方面,用于检测AD的CAD系统不能像预期的那样提高其检出率[3]。受其研究独特性的启发,该研究开始于AD领域,以发现乳腺癌早期阶段的这项工作使用AlexNet和SVM将AD与乳房X光检查中的其他异常区分开来。此外,提出了各种技术的增强所提出的计划。AD的特征在于其针状图案。这种纹理是高度依赖于尺度的,需要多分辨率的方法。图像的空间和空间频率分析是通过小波的卷积实现的[4]。多年来,以下常规方法在实践中。通过Gabor滤波器、曲波、张量小波、复小波等方向变换对乳腺图像中的毛刺进行检测,与乳腺图像卷积后提取AD的纹理信息。提取了光谱特征、基于灰度共生法的Haralick统计特征、Laws特征、分形维数等纹理特征。最后,纹理信息用于检测/分类。其中一些方法在这里解释。在参考文献[5]中,AD使用局部和全局特征的融合来表征,其中局部特征(Chebyshev矩和Haralick特征)与全局特征(通过Laws的纹理能量度量、通过Gabor的纹理能量度量和分形特征)结合。支持向量机分类器支持异常和正常乳腺X线照片的分类。在mini-MIAS数据库[6]上进行多类分类,准确率为93.17%。参考文献[7]研究了感兴趣区域(ROI)大小在分类过程中的重要性。基于灰度共生矩阵的特征、基于分形维数的特征和傅立叶功率谱从各种大小的ROI中提取SVM分类器识别来自非AD的AD,mini-MIAS的准确率为95.34%,筛查乳腺X线摄影数字数据库(DDSM)数据库的准确率为92.94%[8]。建议重视中枢性AD和外周性AD等AD的分类在回顾性观察中,在疾病的发展阶段,乳腺组织的正常方向图案使用Gabor滤波器和相位图定位AD的潜在位点[3,9使用双有界支持向量机[14,15]将错误检测最小化使用Gabor滤波器和相位图识别感兴趣区域[3,9灰度共生矩阵、毛刺特征和熵特征构成特征矩阵。在241个特征中,排名靠前的特征由具有递归特征消除的多重双约束支持向量机入围。该程序在每个图像5.3个假阳性(FP)对基于分形的人像使用二维经验模式分解算法[16]的乳房X线照片的曲线下面积(AUC)Az为0.95。广告使用Gabor滤波器形成来自mini-MIAS数据库的十九幅AD图像的概率图[3,9基于这些AD图,进行真阳性和假阳性的研究,其对每种的灵敏度为79%。纹理描述符被描述为局部映射模式和Haralick特征的组合。在将特征输入馈送到多层感知器神经网络后,实现的分类精度高达83%[18]。据报道,本地映射模式可以更好地描述纹理相比,本地二进制模式和几个Haralick的描述符。通过识别乳房X线照片中的脊发现AD位置。合成模式生成类似于AD模式,并使用支持向量机进行测试。该方法报告的灵敏度为90%,26个FP/乳房X线摄影[19]。基于三个自适应Gabor滤波器,在参考文献[20]中检测乳腺。选择三个Gabor滤波器中的一个作为最佳匹配来表示乳腺结构。Radon变换和Gabor变换检测了参考文献[21]中AD的东方特征。对于AD的确认,使用极坐标中的2D傅立叶变换。实现了68%和0.86 FP的灵敏度。方向性分析使用曲波、轮廓波、张量和复小波进行[22]。通过计算角分辨率和角选择性来捕获AD的方向活动。结果表明,复小波变换优于其他小波,因此,能够代表AD的针状物许多研究人员报告说,分析毛刺使用Gabor滤波器与一些纹理措施。虽然,Gabor滤波器满足方向模式检测的要求,但这种经典的方法具有计算复杂度和大存储器的先决条件。Gabor滤波器的设计参数优化取决于图像频率尺度[23]。AD的CAD仍然是一个没有实际意义的问题。在过去的几年里,CNN已经被证明是优秀的,由于其高性能,高精度,简单/复杂的特征提取。许多研究人员提出了基于CNN的肿块或微钙化检测系统,但很少有AD的检测系统。以下研究报告提到了在这方面所做的工作为了发现AD的存在这是通过基于区域建议卷积神经网络的方案来完成的。级联SVM分类器从其他乳房X线照片中分离AD区域。该系统记录了80%的灵敏度和特异性[24在参考文献[25]中,使用AlexNet和一些特征的融合关于基于CNN的乳房X光检查系统的开发的概述[26]集中在肿块检测诊断中的经验证的方法和改进AD是乳腺癌生长的重要指标[27],更大的重点是优先放在研究AD超过其他恶性肿瘤。为了验证提取的特征的有效性,Vedalankar等人医学信息学解锁23(2021)1005513σCNN(i. e.学习的特征),卷积神经网络(AlexNet)被适配。所提出的基于AlexNet的方法提取强大的学习特征,用于AD和所有其他类型的mam-mogram的分类。分类是通过使用支持向量机。本文的主要贡献是:通过(a)应用一种称为测试时间增强(TTA)的最新增强技术,(b)形成平衡类,(c)融合学习特征和手工特征,逐步改善分类结果。通过多种数据库的组合,在一定程度上解决了临床数据类别不平衡的主要缺点。该方法包括少数类的过采样和多数类的欠采样本文的网站地图是以这种方式编纂的:第2节呈现了涵盖数据采集、预处理、特征提取和分类的材料和过程。第3节涉及实验装置。第4节强调了比较结果和论点。最后,在第5节中给出了一个结束。2. 材料和方法本实验的主要目的是使用CNN处理乳腺X线摄影中的AD。该系统是建立一个典型的CAD阶段该系统的方框示意图如图所示。1 .一、2.1. 数据采集在筛选程序以及公开可用的数据库中,大多数病例是正常的,很少有病例有疑问,特别是AD恶性肿瘤。结果,不平衡的数据在分类问题中产生有偏差的结果。因此,临床数据集和研究样本数量的选择是一项重要任务。为了克服类别不平衡,选择了三个常用的数据库:CBIS-DDSM[28- 这些数据库的一些特点见表1。为了建立CBIS-DDSM数据库,对基本版本进行了一些修改 DDSM数据集这些是:丢弃不清晰的乳房X线照片,将无损JPEG图像转换为DICOM图像,相对于其ROI裁剪乳房X线照片并由专家进行精确分割。此外,数据集被分成80%的训练集和20%的测试集,并可用于分类目的。2.2. 预处理AD由于其复杂的性质,即具有低清晰度、低对比度、差质量、密度因素、噪声干扰、不规则边界、大小和形状,经常被误诊或未被注意所以说,要找到一个合适的位置[7]。预处理在此类临床图像的正确分类中起着至关重要的作用。通常采用直方图均衡化、对比度受限自适应直方图均衡化(CLAHE)、中值滤波、反锐化掩模等预处理例程来提高图像质量、图像平滑和降噪。2.2.1. 图像增强对于图像,全局级预处理通过以下方式完成Z=I-μ(一)其中I是图像,μ和σ是图像的平均值和标准偏差,Z是归一化图像。等式(1)-图像的直方图计算为:表1乳腺X线照片存储库摘要数据库DDSM [8]CBIS-DDSM [28迷你MIAS [6]图像尺寸3000至6000像素可变尺寸1024 ×1024查看MLO,CCMLO,可用图像2,62010,239322格式LJPEGDICOMPGM正常9140207恶性695未提及56话地面真理可用,各种各样的图像,因此受欢迎提供地面实况,DDSM分组,DDSM地面实况的更新和标准化版本(*MLO-内外斜位,CC-中央静脉,LJPEG-无损JPEG,DICOM-医学数字成像和通信,PGM-便携式灰度图)。Vedalankar等人医学信息学解锁23(2021)1005514图二、 表示使用微调CNN架构对乳房X线照片进行分类的示意图。h i∑ ΣM{1,如果I(x,y)=i(二)增强 的 对比 的 AD 与 周围 乳腺 面积同时[]=[]个字符x=1y=10,否则保留图像细节。在图像上实现CLAHE的两个基本参数是图块数量和裁剪限制。使用累积分布函数获得均衡图像,CDF[I[x,y]]-CDFmin剪辑限制范围从0到1,而瓷砖的数量是根据图像的大小自动确定的。削波限制主要是噪声放大。计算每个图块的直方图,g[x,y]=(N × M)-CDF最小值×(L-1)(3)重新分布,使直方图的高度不超过剪辑限制[31]。CLAHE用于医学成像,其中,其中N、M是图像的行和列,L是灰度级的数量。使用所考虑的图像部分的直方图来执行该图像部分的直方图均衡化。对比度根据邻域的像素进行调整[4]。最大值用于重新分布图像部分中的灰度级,以更好地表示感兴趣的对象:在这种情况下是AD。CLAHE是一种先进的直方图均衡化技术。CLAHE的应用画面很暗[32]。采用各种图像预处理技术来使图像适合于由CNN处理,诸如应用图像增强技术和扩增。据观察,如果对数据进行预处理,则基于CNN的系统的性能将得到增强[32然而,如何选择最佳的预处理技术,以进一步提高AD检测系统的分类率,仍然是一个悬而未决的问题。图三. (a)AlexNet用于提取学习特征(b)融合来自CNN的学习特征和馈送到SVM的手工特征,用于分类AD和非AD。NVedalankar等人医学信息学解锁23(2021)1005515∑=()==1=σxσy2.2.2. 数据增强大量的样本也是CNN的必要前提均匀性=∑∑11j2p(i,j)(6)作为分类器。目前数据库中的样本数量相对于CNN所需的样本数量来说非常少。数据扩充是一种I jN-1+(i- )通过转换原始数据来增加人口的方法。训练图像的许多实践,如旋转,裁剪,平移等,都适用于数据增强[35]。在参考文献[36]中,在几种增强技术之后,从DDSM数据集的200个样本和乳房X射线摄影数据集的100个样本形成了大约21,600个ROI。从基于CNN的AD分类获得的结果产生AUC为0.74。2.2.3. 测试时间增加(TTA)测试时间增强是训练数据集和测试数据集的数据增强,以便模型能够正确地对图像进行分类。在这种情况下,模型具有更高的捕获目标形状并相应地进行预测的机会。当模型在样本数上滞后时,会导致评估参数的值较少。在这种情况下,使用TTA [37]。2.3. 特征提取一个大的数据集的维数减少,采用特征提取。特征提取有助于降低该过程的计算复杂度。在这项研究中,学习和手工制作的功能提取。2.3.1. 从AlexNet从预训练的网络中提取特征并将其用于分类是一种流行的做法。CNN的一般结构如图2所示。CNN有许多可训练的阶段堆叠在一起,后面是一个监督分类器和一组名为特征图的数组。CNN架构的三个主要层是卷积层、池化层和全连接层。建议的程序是基于一个流行的CNN i。e.AlexNet [38,39].AlexNet由五个卷积层、三个池化层和两个全连接层组成,拥有大约6000万个自由参数。Alexnet被微调为两个类别而不是1000个类别。对比度=pij(i-j)2(7)i,j=0图3(a)示出了特征提取模式下的Alexnet,其中使用了最后一个全连接层(“FC 7”)上的激活函数。图 3(b)显示了从“FC7”学习的特征和手工制作的特征的融合2.4. 分类许多研究人员采用线性判别分析和人工神经网络,当数据集足够大时表现得更好。SVM在小数据集中通常是首选的,以便更好地泛化以及线性和非线性问题。SVM将数据分成具有线或超平面的类[5],以将样本拟合到特征空间中。支持向量机制定了一个超平面,以这样的方式,两个类之间的分离幅度是最大的。数据的分离是通过高斯(径向基函数),多项式和线性核[5,7]完成的。2.5. 评价所提出的方案按精度(Acc.)分级, 灵敏度(Sens.),专属性(质量标准),精密度(Pr.),F1评分(F1)和曲线下面积。当数据集具有自然分布时,准确性不应该是唯一的度量,因为它可能会由于许多TN而误导结论。精确度被指定为TP的数量与总阳性预测的比率,并衡量分类器的可靠性。低精度值表示许多FP。灵敏度是测试数据中TP的数量与总阳性总数的除法,这是分类器完整性的度量。低灵敏度标志着大FP。最后,F1分数被描述为召回率和精确率的加权平均值[5,7]。等式8它有许多层,执行各种功能。图3(a)中的层1至层5展示了卷积层。卷积层中的每个神经元测量它们的权重和与输入体积相关联的局部区域之间的点积。池化层用于沿空间维度的下采样操作,以简化计算并增加强度。神经元在完全连接的精度TP+TNTP+FP+FN+TN敏感回忆TPTP+FNTN(八)(九)层与前一层中的每个神经元都有完全连接,类似于普通的前馈神经网络。对于要素提取,图层特异性=TN+FP(10)使用预先训练的网络的激活函数学习特征被广泛用于许多生物医学图像分类应用[39]。2.3.2. 手工特征在基于CNN的系统中,学习和手工特征的组合可以更好地描述医学图像的分类问题[32]。使用手工制作的功能以及学习到的精度TPTP+FPF2×(精确度×召回率)精确度+召回率3. 实验装置(十一)(十二)特征是通过添加一些方向特征来提高检测率。有很多方法可以提取手工特征。在这项研究中,简单但流行的14个Haralick特征用于描述AD[40]。在等式(4)能量=∑∑[p(i,j)]2(4)我J逐步实现对AD失真的乳房X线照片和所有其他非AD样本进行分类。此外,它找到了更好的方法来提高分类性能,以最好地代表AD。所有实验都由Matlab R2017a在具有8 GB内存和2.6 GHz I5 CPU的64位Windows8上支持。3.1. 数据收集和实验班的形成相关性=∑i∑j(ij)p(i,j)-μxμy(五)数据不平衡的问题可以通过少数类的过采样和/或多数类的欠采样来解决。少数民族样本的数量是通过采取三者Vedalankar等人医学信息学解锁23(2021)1005516××表2类的形成:阳性(AD)类和阴性(非AD)类的样本。数据库。CBIS-DDSM数据集中的图像有两种类型,即精确分割的完整图像和ROI [38]。由于CBIS-DDSM数据库中没有正常图像,因此随机乳腺X线摄影的选择全乳房X线摄影(隆乳和TTA)作物乳房X线摄影(隆乳和TTA)AD(+ve类)66(CBIS-DDSM)15(DDSM)19(小型-MIAS)总AD=10083(CBIS-DDSM)17(DDSM)19(小型-MIAS)总AD=119非AD(除AD和正常外的所有畸形)(-ve分类)75(CBIS-DDSM)总AD= 150115(CBIS-DDSM)AD总数=215非AD(正常)(-ve类)75(微型-MIAS)100(微型-MIAS)加固后2,2503,006从微型MIAS数据库中截取并收集。各种实验的样品选择见表2。拟议的研究是基于AD和非AD类乳房X线照片的分类。 图4示出了作为类别1(AD类别)和类别2(非AD)的类别的形成的示例。据观察,AD的一些图像由于其模糊的性质、微小的尺寸和与其他异常(例如,毛刺状肿块)的相似性而被错误分类(例如,图4a和图4c)。图4中所示的实验室具有不同的尺寸,并被调整为256 × 256像素。3.2. 预处理AlexNet的先决条件是大小为227 227像素的RGB图像。这意味着训练集和测试集中的图像(从三个不同的数据库中选择)被转换为所需的大小。因此,所有的图像进行相应的变换,并通过中值滤波和CLAHE进行预处理.限幅值取为规定限值内的0.4此外,增强通过将每个图像旋转0、90、180和270度,沿x、y方向剪切轴,加上高斯噪声与一些均值和方差等。增强导致3,006个ROI的扩展样本集在增强期间,假设在应用增强后,AD的基本性质保持不变。见图4。描述各种异常的感兴趣区域,这些异常被分类为AD和非AD类别1类(AD类别)(a)结构变形P00116和2类(非AD类别)(b)III定义的不规则毛刺肿块Vedalankar等人医学信息学解锁23(2021)1005517P00177,(c)不规则毛刺肿块P00118,(d)分叶外切肿块P00156,(e)分叶不规则肿块P00147,(f)淋巴结肿块P00343,(g)微分叶肿块P00194,(h)模糊肿块P00200,(i)椭圆形外切肿块P131,(j)圆形外切肿块P00099,(k)正常ROI。从CBIS-DDSM数据库[ 28-30 ]中获得图像(a)-(j),从mini-MIAS数据库[ 6 ]中裁剪正常图像mdb 006-ROI。Vedalankar等人表8医学信息学解锁23(2021)1005518×当使用全乳腺X线照片进行实验时的分类结果。不增加测试时间的SVM核Acc.Sens.规格PR.F1AUCAcc.Sens.规格PR.F1AUC线性0.710.670.530.620.640.810.730.690.540.630.660.82二次0.740.690.540.640.660.830.750.70.550.650.670.84立方0.730.690.540.640.660.830.750.70.550.630.660.84精细高斯0.680.650.520.590.610.750.680.650.520.590.610.75中高斯0.740.680.540.630.650.820.740.690.540.640.660.83粗高斯0.70.670.530.620.640.80.70.670.530.620.640.83.3. 学习和手工特征提取标记的训练和测试样本输入到AlexNet进行特征提取。从CNN学习的3006 ×4096个特征和3006 14个手工(Haralick的GLCM)特征被提取。对于GLCM矩阵X的计算,兴趣点及其相邻点由适当行和列偏移量设置[7]。通过应用最小-最大方法对特征矩阵X进行归一化,并将其馈送到SVM以进行所需的二进制分类。3.4. 支持向量机SVM被训练用于将样本分类为AD或非AD。训练是通过适应各种内核,如线性,径向基函数和多项式。70%的图像用于训练,其余用于测试。该过程重复五次,并报告平均值。对分类结果进行了评价。4. 结果和讨论该研究是基于AD的识别,这表明乳腺中某些异常的早期发展。为此,在一个类别中选择AD图像,并且在另一个类别中选择所有其他图像在许多条件下,分类结果的逐步改进得到了经验验证最初的实验是使用一个小而流行的mini-MIAS数据集进行的,其中19个AD在阳性类中,303个非AD在阴性类中。由于巨大的类不平衡,获得的准确率为62.5%。其他参数,如灵敏度、精度、F1等,由于较大的FP和FN而较差。为解决这一问题,采取了以下战略1. 多数类别抽样不足-总体而言,如表1所示,可用数据库中有足够的乳房X线照片样本。据观察,非AD样本的计数远多于AD样本,如通常在自然集合中发现的。可用AD样本总数见表2。因此,为了保持类别平衡,通过使用欠采样从大多数样本中选择有限数量的非AD乳房X线照片。因此,泛化可能会受到影响。2. 通过增加训练集对少数类进行过采样-此外,从各种数据库中收集AD样本的数量,并以与第2.2节和第3.2节所述相同的方式进行处理。第4.3节详细讨论了不平衡和平衡类别中的样本选择。3. 训练集和测试集i的扩充。e.试验时间增加-增加前后的样品数量见表2。4. 融合了学习和手工制作的功能-这些功能相结合,以更好的方式表达广告选择样本和分类的最佳方法取决于手头的数据集数量和特定的图 5. 结果 的 分类 当 充分乳房照片是 使用做实验应用程序.三个存储库的组合降低了错误检测的数量。使用CNN提取特征,并相应地训练SVM分类器。如表2所示,进行了拟定实验的样品选择和分组。AD和非AD图像的选择标准是在两个类别之间保持适当的平衡,并根据包含AD异常的可用乳腺X线片。由于在一些异常中的高度相似性,例如毛刺块、结构变形、未精细化异常,所以实验各种核以检查AD样本如何能够适合于相应的类。每个测试都是通过使用多个内核i来执行的。e.线性、二次、三次、精细高斯、中间高斯和粗糙高斯。4.1. 病例1-增强的完整图像在这种情况下,使用被称为全图像的乳房X线照片的精确分割版本。如第3.2节所述,以相同的方式对完整的乳房X线照片进行预处理。分类结果见表3。4.2. 案例2-测试时间增强的完整图像为了有更多的样本用于训练和测试,使用了TTA。表3表示两种增强方法的比较:1.应用于训练集的增强,以及2.增强应用于训练以及测试集。在实验中,与许多自然图像数据集相比,可用的训练图像的数量相对较少。 在TTA中,为测试集中的每个图像创建多个增强副本,以便模型可以对每个图像进行预测。因此,测试时间的增加大大改善了实验结果,如图所示。 五、较低的特异性和精确度值是由更多的FP引起的,这是预期的,因为阴性类占主导地位,Vedalankar等人表9医学信息学解锁23(2021)1005519××使用裁剪后的乳腺照片进行实验时的分类结果。当两个类都不平衡时当两个类都平衡时Acc.Sens.规格PR.F1AUCAcc.Sens.规格PR.F1AUC线性0.860.760.870.820.790.870.860.780.870.820.790.94二次0.880.790.90.850.810.910.890.80.90.850.820.96立方0.880.780.890.850.810.910.890.80.90.850.820.96精细高斯0.740.630.750.780.690.740.750.640.770.790.70.84中高斯0.860.770.870.820.790.870.870.780.880.830.80.94粗高斯0.830.750.830.790.760.830.830.740.840.810.770.91表5当裁剪的乳房X线照片用于实验时的分类结果(平衡数据,TTA)。SVM核Acc.Sens.规格PR.F1分数AUC线性0.870.780.880.820.790.94二次0.890.80.90.860.820.96立方0.890.80.90.850.820.96精细高斯0.750.650.780.790.710.85中高斯0.870.780.880.830.80.94粗高斯0.840.740.850.810.770.92图 6. 结果 的 分类 当 作物乳房照片是使用做实验与其他针状结构有很大的相似在所有三个数据集中,全尺寸乳房X线照片的图像尺寸相对于AD中针状物的尺寸非常大(几千像素),即大约32 8像素[10]。此外,AD的半径从23到117像素不等[7]。这使得广告很难识别。因此,决定在乳房X线照片的裁剪版本上实验该模型。4.3. 案例3 ROI(裁剪版本),带增强为了限制搜索区域,对乳房X线照片的裁剪版本进行了测试。上述试验的样品选择按表2进行。实验是通过采取不平衡以及平衡类。可用数据集具有足够平衡数量的肿块或微钙化恶性肿瘤样本。虽然,在AD的情况下,阶级不平衡非常大,这是不可接受的。在这种情况下,如果CNN直接由不平衡的数据集训练,它可能会使预测倾向于更常见的类别,即非AD类,导致大FN。与此同时,寡不敌众往往被错误分类。对于该测试,以以下方式选择AD和非AD1. 平衡类包括119个AD样本和121个非AD样本,2. 根据表2,不平衡类包括119个AD样本和215个非AD样本。案例3和案例4仅考虑从预训练的CNN接收的学习特征进行。表4说明了由于不平衡类和平衡类而产生的分类结果的比较。当乳房X线照片的裁剪版本已经试验到完整的乳房X线照片时,发现总体结果得到改善。准确度和灵敏度随着近似相同数量的AD而增加,并且在分类期间测试非AD样品,如图6所示。第4.2节和第4.3节中提到的结果略有改善,见图7。采用裁剪X线片和TTA技术进行实验时的分类结果。TTA应用于完整的乳房X线照片,并对裁剪的乳房X线照片测试平衡类条件。因此,相同的技术适用于乳房X线照片的裁剪版本4.4. 用例4 ROI(裁剪版本),测试时间增加训练和测试ROI被分别增强,以确认系统是否将TTA的结果与表4中提到的最佳结果进行比较。结果逐步增加,如表5所示。通过应用图1所示的TTA观察到非常小的改善。7.第一次会议。4.5. 案例5 ROI(裁剪版本),融合了学习和手工制作的功能在[39]中,有人建议将学习和手工特征相结合可以更好地解决基于CNN的分类问题。这两种表示的组合产生了一个更好的描述肿块或微钙化分类。使用手工特征的原因是为了验证分类器的学习是否可以由训练数据集指导,该训练数据集具有广泛的纹理和形状特征变化。为了验证性能是否可以进一步提高,融合了学习特征和手工特征,Vedalankar等人表6医学信息学解锁23(2021)10055110使用CNN提取的特征和Haralick特征(融合)的分类结果。当两个类都平衡时当两个类都不平衡时Acc.Sens.规格PR.F1AUCAcc.Sens.规格PR.F1AUC线性0.860.780.890.830.80.940.860.770.870.820.790.9二次0.920.810.90.860.830.960.870.790.90.850.810.94立方0.910.810.90.860.830.960.880.790.90.850.810.93精细高斯0.750.650.780.80.710.850.750.640.760.790.70.84中高斯0.870.780.890.840.80.940.860.770.880.830.790.9粗高斯0.840.750.850.830.780.90.840.750.830.80.770.92见图8。使用裁剪乳房X线照片时的分类结果。学习和手工特征的融合用于实验。表7病例1至病例5的分类结果总体逐步增加图9.第九条。 通过应用各种方法逐步增加。计算。表6和图8示出了学习的和Haralick的GLCM特征的融合具有足够的辨别能力来有效地分析TP和FP ROI。结果证实了处理广告时特征组合的重要性。该方法可以进一步扩展,增加了各种特征提取方法,如多重分形分析,谱分析等和竞争特征见图10。 ROC曲线描绘了“曲线下面积”。选择方法。表7和图 9显示了分类结果的摘要。最好的结果被发现的情况下,使用裁剪的乳房X线照片处理的数据增强,平衡类,多项式二次核SVM,手工制作和学习功能的融合。总体分类器性能的测量之一,即最大AUC被计算为0.96,如图2所示。 10个。在第4节表7中进行t检验以比较AUC值。前三个AUC值在组1中采集,接下来的三个值在组2中采集。p值为0.04,反映了AUC参数的统计学差异总之,应当称赞的是,当采用以下条件时,结果是非常令人鼓舞的。1. 正确裁剪感兴趣区域-将ROI与完整乳房X线照片进行比较时2. 两个类是平衡的-结果由非AD类主导。因此,阶级必须平衡。3. 使用测试时间增强-当增强应用于训练以及测试集和大型测试图像时进行验证。4. 采用二次核函数训练SVM分类器。5. 将数据集分割为70%-30%,分别用于训练和测试。将该过程重复五次,并报告平均值。6. 融合的手工制作和学习的功能,正确识别AD被认为是。测试Acc.Sens.规格PR.F1分数AUC完整无TTA0.740.690.540.640.660.83FullWithTTA0.750.700.550.650.670.83作物不平衡0.870.790.900.850.810.9作物平衡0.890.800.900.850.820.96作物平衡TTA0.890.800.900.860.830.96作物平衡融合0.920.810.900.860.840.96Vedalankar等人医学信息学解锁23(2021)10055110表8一个对比的建议工作与以前的工作。分类)(%)[24]第10段。[38]第三十八话+1191正常CNN肿块(SM),87%-AD+SMS凯伦·德鲁克[39] 56(局灶性)不对称或AD; 87微钙化; 58个肿块由AlexNet分类计算Arthur C. 哥斯达黎加[36]200 100张量流RGoogle创建的框架–建议的方法119 AD+ 215非AD通过CNN分类计算建议的方法119 AD+ 215 non-AD由CNN和Haralick计算分类92 81.5 90.83 0.96有时由于许多原因而获得不可预测的结果。其中一些被列为:1. 乳房组织结构因人而异。2. 乳腺组织密度在AD识别中的作用,即当乳腺密度增加时,结果恶化。3. AD与其他异常的相似性,特别是毛刺肿块可能会偏离结果。表8是本研究考虑的工作的定性审查。由于实施情况的差异,不可能的贡献总结如下:当处理的建筑失真,数据不平衡是一个至关重要的问题,可能会影响分类的性能。因此,如果对训练集的增强、测试时间的增强以及学习特征和手工特征的融合进行测试,则分类性能得到增强。5. 结论开发一个高效的AD分类CAD系统是一项具有挑战性的任务。提出了一种基于Alexnet支持向量机的适度技术,用于将AD从正常乳腺X线照片和其他类型乳腺癌的乳腺X线照片中分离出来。这项研究为乳腺癌的早期检测研究开辟了一个新的思路。这些声明是基于对mini-MIAS、DDSM、CBIS-DDSM乳腺X线照片数据库进行的实验结果。 该方法优于传统方法。AlexNet经过微调,提供了可以区分AD和非AD类的功能。为了提高系统的性能,本文尝试了多种方法来处理类不平衡问题、特征融合、测试时间增加等。该系统的最高准确度为92%,灵敏度为81.5%,特异性为90.83%。达到的曲线下峰面积为0.96。因此,需要更加重视对广告的检测而不是分类。将来,为了修改该方案的性能,可以对来自当地医院的可能具有许多AD乳房X线照片图像的真实数据研究该方法。将AD与其他异常分离以保持CAD系统的准确性的尝试在很大程度上是成功的。由于异常与周围区域的对比度很差,且性质复杂,因此该方法在正确分类方面存在滞后。因此,可以更加强调对比度增强技术,更好的分类。因此,根据总体研究,建议可以使用卷积神经网络和支持向量机作为用于识别乳房X线照片中的结构失真的良好替代。竞合利益作者声明,他们没有已知的可能影响本文所报告工作确认作者感谢筛选乳腺X线摄影数字数据库的精选乳腺成像子集(CBIS-DDSM)、乳腺作者感谢L博士。V Padmarani Rao,教授,P.G.英语系和研究中心,是的- hwant Maiddyalaya,南德,印度。这项工作得到了印度政府国家项目实施单位的支持,以继续在TEQIP-II期间建立EXCellence中心(CoE)的活动,参考编号为AC/TEQIP-III/MHRD/,日期为2020年12月3日。引用[1] 世界卫生组织。Ω,https://www.who.int/cancer/prevention/diagnosis-screening/breast-cancer/en/. [2017年5月]。[2] 国立癌症预防研究所。http://cancerindia.org的网站。in/cancer-statistics;2017.[3] BanikShantanu,RangayyanRangarajM,LeoDesautelsJE. R'enyi熵用于检测先前乳房X线照片中的结构失真的角展度。2011年IEEE医学测量与应用国际研讨会。IEEE; 2011年。p. 609- 12[4] 彼得鲁·玛丽亚议员加西亚·塞维利亚·佩德罗。图像处理:处理纹理。Wiley;2006.[5] Anuradha C Phadke,Rege Priti P.融合局部和全局特征对乳房X线摄影异常进行分类。 Sāadhanāa2016;41(4):385- 95.[6] 乳腺摄影图像分析学会数据集。2017.http://peipa.essex.ac.uk/info/mias.html。[7] Amit Kamra,Jain VK,Singh Sukhwinder,Mittal Sunil.基于支持向量机分类器纹理分析的乳腺X线摄影图像结构畸变特征及其临床评价。J Digit Imag 2016;29(1):104-14.[8] dsm数据库。2017. www.http.marathon.csee.usf.edu/Mammogr
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Hadoop生态系统与MapReduce详解
- MDS系列三相整流桥模块技术规格与特性
- MFC编程:指针与句柄获取全面解析
- LM06:多模4G高速数据模块,支持GSM至TD-LTE
- 使用Gradle与Nexus构建私有仓库
- JAVA编程规范指南:命名规则与文件样式
- EMC VNX5500 存储系统日常维护指南
- 大数据驱动的互联网用户体验深度管理策略
- 改进型Booth算法:32位浮点阵列乘法器的高速设计与算法比较
- H3CNE网络认证重点知识整理
- Linux环境下MongoDB的详细安装教程
- 压缩文法的等价变换与多余规则删除
- BRMS入门指南:JBOSS安装与基础操作详解
- Win7环境下Android开发环境配置全攻略
- SHT10 C语言程序与LCD1602显示实例及精度校准
- 反垃圾邮件技术:现状与前景
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功