没有合适的资源?快使用搜索试试~ 我知道了~
沙特国王大学学报基于NROI的特征学习用于使用深度卷积神经网络的肺结节的Supriya Suresha,Subaji Mohanba印度Vellore Vellore理工学院计算机科学与工程学院b工业和国际方案研究所,Vellore理工学院,印度阿提奇莱因福奥文章历史记录:收到2019年2019年11月26日修订2019年11月28日接受在线发售2019年保留字:深度学习卷积神经网络分割数据扩充A B S T R A C T在计算机断层扫描(CT)图像中识别准确的肺结节边界是计算机辅助检测系统(CADx)的关键任务。将CT图像分为良性、恶性和非癌对于早期发现肺癌以提高生存率至关重要。在本文中,提出了一种使用端到端学习深度卷积神经网络(DCNN)对肺部结节进行自动肿瘤分期分类的方法。研究中使用的图像来自肺部图像数据库联盟和传染病研究所(LIDC- IDRI)公共存储库,包含1018例病例。基于四位放射科医师的注释,将具有候选结节的肺部CT图像分割成52× 52像素的结节感兴趣区域(NROI)矩形,具有地面实况(GT)值的标记该方法旨在分析和提取自学习的NROI的显著特征由不同结构的结节组成DCNN使用NROI样本进行训练,并根据肿瘤模式进一步分类为非癌性,良性或恶性样本。数据增广和丢弃用于避免过拟合。将该算法与最先进的方法和传统的手工特征(如肺部CT图像的统计、纹理和形态学行为)进行了比较。使用结节分组数据集观察到DCNN性能的一致改善,并且实现了97.8%的分类准确度、97.2%的特异性、97.1%的灵敏度和0.9956的受试者工作特征曲线(AUC)评分下的面积,同时降低了低假阳性。©2019作者由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍肺癌是世界范围内的主要疾病之一,在其他类型的癌症中导致高死亡率。根据美国2019年的统计数据,美国癌症协会估计有近228,150例新发肺癌和支气管癌个体和142,670例死亡(Siegel et al.,2019年)。为了提高生存率,肺癌的早期发现起着至关重要的作用。特别是在早期阶段识别肺结节需要放射科医生*通讯作者。电子邮件地址:vit.ac.in(S.苏雷什),msubaji@vit.ac.in(美国)Mohan)。沙特国王大学负责同行审查因为结节密度可能具有与其它肺结构相似的解剖学特性(Xiuhua等人,2011年)的报告。然而,计算机辅助诊断/计算机辅助检测系统被认为是用于自动肺结节检测的替代方法,以帮助放射科医师克服常规阅读的问题(Jacobs等人, 2014年)。在CT图像中识别准确的候选结节边界是CADx的关键任务,因为候选结节及其周围具有相似的可视化特征。此外,候选区域显著特征的提取也是关键。通常,使用传统的手工特征或深度学习方法(深度神经网络)提取特征用于肺部结节分类。传统的手工特征包括统计特征、纹理特征、密度特征和形态特征,并使用很少的分类技术对其进行进一步分类。现有的CADx系统需要将这些特征设计为基本模型。但是该过程是耗时且复杂的(Roth等人,2016年)。此外,这些特征将相互关联,以获得预期的性能指标。此外,减少虚假https://doi.org/10.1016/j.jksuci.2019.11.0131319-1578/©2019作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。制作和主办:Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.comS. Suresh,S.Mohan/ Journal of King Saud University1707阳性在结节分类中起重要作用,增加了敏感率。最近,许多研究人员已经开发了自动学习和提取特征图的架构(Silva等人,2017;Tajbakhsh和Suzuki,2017; Yuan等人,2018)使用深度学习技术。这些技术用于检测和分类候选肺结节,而不考虑手动 提 取 的 纹 理 特 征 ( Wang 等 人 , 2017a , b; WikipediaContributors,2018).从具有多层的架构和输入数据的结构模型(如深度神经网络/混合结构)学习特征是最近的趋势变化概念。研究结果表明,与传统的机器学习概念相比,深度神经网络算法的表现更好(Luet al.,2018; Rastegari等人,2016年)。深度神经网络的最新进展涉及并行计算的概念,在使用图形处理单元训练巨大的注释数据集时具有更高的可访问性和可负担性。许多研究人员在使用深度学习算法对大型数据集进行训练和分类以进行模式识别方面取得了进展(Zhang等人,2019年;王例如,2018年)。这也导致了在医学成像应用中使用深度神经网络算法的实质性进步(Tan等人, 2017年)。在这项研究中,我们结合了一个端到端的DCNN架构,用于候选结节特征提取和分类,根据恶性可疑。使用DCNN提取、训练和测试NROI,并且根据恶性肿瘤可疑性的阶段将每个检测到的候选结节分类为正常(非癌性)、良性(1级或2级)和恶性(4级或5级)。本文的结构如下。第2节介绍了相关的工作。第3节描述了使用传统手工方法和深度卷积神经网络提取的特征,将候选结节分割和分类为良性、恶性或非癌的方法。第4节说明了所提出的方法的实验和评价。第5节讨论结果。2. 相关工作如前所述,具有结节分割、特征提取和结节分类的肺结节检测系统具有要克服的某些挑战性任务。在本节中,讨论了与所提出的方法相关的先前工作。 大多数与肺癌诊断相关的研究不仅依赖于从传统手工方法中提取的特征,而且还使用自动化的端到端学习特征。为了更精确地组织相关工作,我们将相关工作分为两组:第一组-与传统手工制作相关的基于特征提取的工作。第2组-2.1. 第一组-与传统手工特征提取相关的作品Wu等人(2013)设计了一种方法,使用纹理和放射学特征的组合区分恶性和良性样本。从2117个CT切片(116个恶性和86个良性)中提取了13个灰度共生矩阵(GLCM)纹理特征和12个放射学特征。 使用反向传播神经网络(BPNN)神经网络对提取的特征进行分类,得到0.91的接收器操作特征曲线(ROC)。de Carvalho Filho等人(2014)开发了一种方法,通过使用质量阈值增强图像来自动检测候选肺结节。候选结节为使用区域生长方法分割。采用遗传算法提取图像的形状和纹理特征,并利用支持向量机分类器进行分类.从Lung Image Database Consortium(LIDC)数据集中共收集了140个新检查,准确性为97.55%,灵敏度为85.91%,特异性为97.70%。Orozco等人(2015)提出了一种肺结节分类方案,该方案使用基于小波特征的描述符,并使用SVM分类器进行分类。从频域子带中提取了19个灰度共生矩阵特征。研究中使用的数据集来自早期肺癌行动计划(ELCAP)和LIDC,包含61张图像(36张结节和25张非结节图像)。该系统的准确性为82%,敏感性为90.90%,特异性为73.91%。de Carvalho Filho等人(2017)使用系统发育多样性指数和遗传算法进一步提取了纹理特征,用于肺结节分类。研究中使用了来自LIDC数据集的1403个结节图像(394个恶性和1011个良性),准确性为92.52%,灵敏度为93.1%,特异性为92.26%。2.2. 第2组-de Carvalho Filho等人(2018)提出了一种分类方法,使用CT图像上基于拓扑的系统发育多样性指数区分良性和恶性样本的模式。为了对提取的特征进行分类,使用了CNN方法。在研究中使用了包括1405个结节(394个恶性结节和1011个良性结节)的LIDC图像数据集,其准确性为92.63%,特异性为93.47%,灵敏度为90.7%,ROC下面积为0.934。Xie等人(2018),使用纹理、形状和基于深度模型的学习信息(FuseTDS)对肺结节进行分类。该方法采用基于灰度共生矩阵的纹理特征,傅立叶形状特征表征肺结节的异质性和DCNN自动学习结节特征切片逐层。每个特征都使用Adaboost BPNN进行训练。三个分类器被融合以区分候选肺结节。对1972个结节(良性1323个,恶性648个)的LIDC-IDRI图像数据集进行了评价,其AUC为96.65%,准确率为89.53%,敏感性为84.19%,特异性为92.02%。Jiang等人(2018)提出了一种用于肺结节检测的基于多组的学习系统来自LIDC数据集的1006个扫描通过Frangi滤波器增强通过4通道CNN检测结节,每次扫描的灵敏度为80.06%,假阳性率为4.7,假阳性率为94%,15.1每次扫描。Xie等人(2019)使用更快的基于区域的卷积神经网络开发了一种自动候选结节检测方案解卷积层用于检测候选结节。为了减少假阳性,在研究中实验在来自LUNA 16个数据集的150414个样本(339个结节图像和150075个非结节图像)上进行训练。对于非结节,候选者被标记为0类,对于结节图像标记为1类。该系统具有86.42%的结节检测灵敏度。Huang等人(2019)设计了一种端到端全自动化框架,用于从CT图像中精确分割候选结节轮廓。该方法包括三个主要阶段。1)更快的区域CNN以检测候选结节2)用于假阳性减少和候选合并的CNN 3)使用定制的完全CNN的结节实验在来自LUNA 16图像数据集的具有223个结节的888个CT扫描上进行1708S. Suresh,S.Mohan/ Journal of King Saud University×××并且导致每次扫描假阳性1次的准确率为91.4%,每次扫描假阳性4次的准确率为94.6%。Lakshmanaprabu等人(2019)提出了一种使用最佳深度神经网络(ODNN)和线性判别分析(LDA)的最佳自动分类方法。用LDA减少了肺结节的深提取特征。采用改进的重力搜索算法(MGSA)对候选结核进行进一步分类。70幅图像用于训练(正常从分层神经网络层的独特特征学习的概念来看,CNN模型有利于图像分割和分类,在医学成像中表现出令人鼓舞的结果。所有上述方法都表现出与准确性和灵敏度相关的有希望的结果,但是很少有方法导致每次扫描或每个患者或每个图像的高假阳性,进而影响分类准确性的性能。然而,CNN方法在建模具有足够样本用于训练的异质肺CT体积采集数据集时确实存在一些不确定性。大多数讨论的方法没有为每个类别的malig-分类,导致过度拟合相同数量的图像样本。设计用于捕获候选结节区域的2D特征的神经网络层次结构将被明确地解决。总之,几种方法在肺结节检测、分割和分类领域中表现出潜在的进展,但仍需要改进以克服挑战性问题,如基于形状、变化的尺寸和位置识别的不规则结构结节的检测,通过减少低假阳性的高灵敏度率,提供适用于多个数据库的鲁棒技术。总之,表1和表2分别表示与基于transmart-crafted的特征提取和深度卷积神经网络方法相关的工作3. 方法本文提出了一种新的方法,用于肺结节的自动肿瘤分期分类,区分恶性与良性和非癌性肺结节。该算法总结在图1中。为了比较,从每个肺结节CT图像中提取四种特征。三个是从transmart-crafted手工制作的方法-统计,纹理和形态学为基础的功能分类使用SVM分类器。 一个人从8层深度卷积神经网络中学习。的使用CNN训练和测试自学习提取的特征,3.1. 数据采集本研究中使用的所有图像均收集自医学上可获得的存储库肺图像数据库联盟和传染病研究所数据集,该数据集由4名放射科专家的1018个带有标记注释的CT扫描组成(Armato等人,2015; Jacobs等人,2016年)。来自LIDC-IDRI数据集的图像大小为512512维。每个CT层厚从1.25 mm到3 mm不等,结节直径从3 mm到30 mm不等,表明恶性肿瘤的可疑级别为1到5级。对CT扫描图像进行预处理,以根据四位放射科医生的注释和标记对NROI进行唯一分割一个XML文件与每个CT扫描病例相关联,并由四名放射科医生进行两阶段注释过程以区分可疑结节。每位放射科医生审查并标记结节/病变,分为三个关键类别:大于或等于3 mm的结节、大于3 mm的非结节根据这些跟踪注释对数据集图像进行分割,以对应于恶性程度,将每个切片中的结节区域提取到52 × 52像素的矩形中,转换为TIF图像格式,以便于处理Lampert等人(2016)。在本研究中,排除了“ID”不明确的结节和恶性程度为3的样本,以更好地区分肺结节。总之,在实验中总共使用了1279个样本,278例良性(LMN)、432例恶性(HMN)和569例非恶性(HMN)癌症样本3.2. 噪声提取和分割使用标记的注释及其来自数据集的对应GT值逐切片提取候选结节区域 图图2示出了由四位放射科专家及其相应的GT注释的具有以“红色”突出显示的肺结节的CT图像。XML文件中对应于癌结节的每个注释候选结节的像素值使用掩模保留,而其余的填充为零,形成大小为52-所有关于结节结构及其形状和大小的信息都是表1与传统手工制作相关的作品基于特征提取。研究论文目的图像数据库图像数量实施-关键区别结果Wu等人(二零一三年)deCarvalho Filho等人(2014年)诺维茨基分类结节检测LIDCLIDCCT切片2117张,116 -恶性,86140项新考试结合13种纹理和12种影像学特征质量保证,ROC曲线为0.91精确度Orozco等人(2015年)诺维茨基分类LIDC和ELCAP61张图片,区域生长分割,基于形状和纹理的遗传算法特征提取,SVM分类器特征提取灵敏度特异性时间复杂度准确度3625-19个灰度共生矩阵特征,SVM分类灵敏度特异性deCarvalho Filho等人(2017年)诺维茨基分类LIDC1403张图片,394 -恶性,1011特征提取:系统发育多样性指数和遗传算法精确度灵敏度特异性S. Suresh,S.Mohan/ Journal of King Saud University1709×表2与基于深度卷积神经网络的特征提取相关的工作研究论文目的图像数据库图像数量实施-关键区别结果de Carvalho Filho等人(2018年)诺维茨基分类LIDC1404个结节,3941011基于拓扑的系统发育多样性指数,分类精确度灵敏度专属性Xie等人(2018年)结节LIDC1972年结核FuseTDS-融合纹理,形状和ROC曲线为0.934%准确度分类图像,6481324深度模型学习,裁剪一个64× 64的正方形区域,嵌入候选结节,基于灰度共生矩阵的特征描述符,傅立叶形状描述符,灵敏度特异性Jiang等人(2018年)Xie等人(2019年)结节检测结节检测LIDC月球161006次扫描150414张图片,特征提取使用Frangi滤波器增强图像(多噪声检测灵敏度- 80.6%,FP为4.7,灵敏度- 94%,FP为15.1灵敏度339150075-使用2D CNN减少假阳性Huang等人(2019年)结节检测LUNA16结节888次CT扫描恶意检测准确度-91.4%,FP为1Lakshmanaprabu等人结节LIDC223个结节70张图片,CNN,CNN用于假阳性减少和候选合并,分割最优深度神经网络准确度精确度(2019年)分类正常良性恶性(ODNN),特征提取-线性判别分析、分类搜索算法灵敏度特异性Fig. 1. 提出的方法的架构。有效地提取适合矩形框架中的肺结节在结节尺寸超过52 × 52矩形尺寸的情况下,对大结节应用下采样以适合直角。 图 3显示了少数NROI图像及其相应的以“红色”突出显示的可诊断结节。3.3. 特征提取3.3.1. 基于深度卷积神经网络的特征提取为了从NROI中自动学习特征,构造了一个8由于每个1710S. Suresh,S.Mohan/ Journal of King Saud University图二. CT图像显示左肺底部小结节,由四名放射科专家及其相应的GT标注为图三.很少有NROI图像及其对应的候选结节。候选结节具有不同的大小和形状,将模板一般化,每个感兴趣区域(ROI)被调整大小为52× 52像素的矩形作为DCNN的输入。而不是考虑大小为512× 512的整个数据集图像用于训练神经网络网络中,只有NROI矩形被用来提高处理时间,存储能力,并提取相关的特征图,以更好地理解DCNN捕获的特征具有候选结节的NROI确定了大部分贡献S. Suresh,S.Mohan/ Journal of King Saud University1711××××××× ××× ××-通过考虑候选结节周围的组织的重要性来进行预测,从而以低的假阳性提高分类准确度。网络滤波器、特征图、输入图像大小由DCNN架构调整,以获得更好的肺结节分类准确性。因此,大小为52 × 52图像块的增强NROI作为输入被传递到DCNN的输入层CNN该研究中包含的架构包括三个卷积层和三个子采样层,这些子采样层通过最大池化、校正线性单元(ReLu)和批量归一化截取以进行显著特征提取,最后是一个连接到3个神经元的全连接层,该神经元将输入模式分类为良性、恶性和非癌症类别之一。图4表示DCNN的结构。第一卷积层有12个大小为5的滤波器,5个特征映射连接到输入层。第二层有8个大小为5 5的过滤器连接到前一层(12 8 = 96 55fil)。ters)。第三层有6个大小为5 5(86 = 48 55过滤器)从前一层使用。每个滤波器从第一卷积滤波器产生12 48 48个图像的2D图像输出。层,如图4所示。可以改变所使用的滤波器的数量以优化训练期间的分类准确度。在输出层(八层)之前的最后一层(其是完全连接的层)使用softmax非线性函数将输入收缩到3 × 3矩阵,所述softmax非线性函数具有落入良性、恶性或非癌性结节的3个类别之一的3个输出神经元。完全连接意味着一层中的每个神经元连接到其他层的同一位置。因此,每个神经元从其对应的神经元接收输入作为线性组合,其中具有前一层中的一组输入权重和偏置。最后,输出层为每个可能的类别提供网络预测的强度。CNN架构中每一层的输出都被归一化,在发送到下一层HHyvärinen和Oja(2000年)之前进行白化以增强对比度。每个卷积层后面是大小为2的最大池化层2(步长为2),用于减小输入面片的大小在非重叠窗口中具有最大强度值的情况下减半,从而降低了计算成本,并有助于保持神经网络对于输入片上的任何平移、变换和失真不变。子采样层中的校正线性单元被应用于输入块中的每个像素将特征图中的所有负值替换为0,并且仅保留非负像素值用于进一步处理。在体系结构中,使用辍学来防止过拟合。此外,在训练网络时,观察到数据分布的变化具有梯度值(趋于减小),因此将批归一化并入算法中,使得每一层独立地学习更多,并更有效地对齐其他层的 数 据 分 布 。 为 了 优 化 DCNN 的 性 能 , 采 用 了 自 适 应 矩 估 计( Adam )优 化器( Wikipedia Contributors , 2019; Kingma 和Ba,2014),学习率为0.1。迭代次数设定为50,批量为100,研究中的二次采样率针对不同的输入参数,如卷积滤波器大小,学习率和架构中的层数进行了系统的表3显示了DCNN架构的输入参数的测试组合3.3.2. 传统手工特征提取为了比较的目的,我们调整了如表4所述的基于统计、纹理和形态的描述符,以表征来自相同NROI的候选结节体素值的异质性。从传统的手工方法中手工提取了总共26个特征,定义了区分特征。使用SVM分类器将所有特征组合并训练用于指定为非癌性、良性或恶性的提取的特征如面积、周长、偏心率、对比度、相关性、能量、熵、均匀性、总和平均值和总和熵在结节分类中起着突出的作用。这些特征被关联以获得预期的性能测量。3.3.3. 数据增强数据扩充是用来克服数据库过拟合问题的技术之一。为了提高分类精度,数据库图像以固定角度(90,180,270)旋转,并在[ 3 3]的范围内平移,形成图像样本的训练数据集,以克服放射科医生标记数据集有限的局限性。此外,为了使每类恶性肿瘤的图像样本数量相等,采用了数据增强技术。此外,在候选结节的平衡数据集上,DCNN在根据学习参数提取的特征见图4。 DCNN的结构1712S. Suresh,S.Mohan/ Journal of King Saud University表4表3DCNN架构的输入参数的测试组合。输入参数值层数4、6、8、10、12内核数量32,16,12,8,6学习率(Alpha)0.01,0.1内核大小3,5与其他2个数据集相比,D1数据集更容易,因为恶性级别3的图像被消除,以更好地区分脉冲结节。此外,与传统的手工制作的统计和基于纹理的描述符相比,该表描绘了DCNN的93.46%的高分类准确度。对于数据集,具有标记为良性(LMN)或恶性(HMN)的中等恶性等级3结节的D2和D3增加了对结节进行分类的难度。具有Adam训练优化器的DCNN架构在输入参数的不同配置上进行了测试,平均值均在88.5%以上,研究中使用的传统手工制作功能进行比较。类别提取的特征纹理灰度共生矩阵1)对比度,2)相关性,3)能量,4)熵,5)同质性,6)自相关,7)集群突出,8)集群阴影,9)逆差,10)熵差,11)和熵,12)方差差,13)相关性信息测度14)相关性信息测量2,15)相异性,16)最大概率,17)和平均值,18)和方差统计19)平均值,20)标准差,21)方差,22)偏度,23)峰度形态24)面积,25)周长,26)偏心率3.3.4. 诺依分类根据放射学专家的结节标记注释,将每个大于或等于3 mm的可疑结节分类为恶性程度的5个阶段之一,范围为1 - 5。将肿瘤水平1和2的样本合并,形成标记为低恶性结节(LMN)的良性样本,其中将恶性肿瘤水平4和5的样品组合,形成标记为高恶性肿瘤结节(HMN)的恶性样品,其中“结节”标记为高恶性肿瘤结节(HMN)。>= 3 mm,带4和5”的水平挡板。具有大于3mm的非结节和小于3mm的结节的样品被归类为非癌样品。此外,使用DCNN训练和测试所有增强的NROI图像,然后将其分类为根据每个输入的概率得分指定的3个类别之一,作为非癌性、良性或恶性样本。4. 实验和评估指标将基于结节恶性程度的LIDC数据集建模的详细分析使用10倍交叉验证,在3个LIDC数据集上评价了该方法,如表5所示。结节的分类准确度为93.46%,如表6所示。我们还评估了当隐藏层中的神经元数量变化时,性能测量是否会发生剧烈变化。但性能的变化是相当稳定的,并且对于对应于特定历元值的特定核大小小于0.4%。最后,在实验的基础上,我们将隐藏层的神经元固定此 外 , 使 用 随 机 梯 度 下 降 动 量 ( sgdm ) 优 化 器 ( WikipediaContributors,2019)重复实验以训练CNN,其配置可评估其性能,如表7所示。SGDM优化器对所有测试的输入参数组合的分类准确率均在88.1%以上,最高可达91.9%如突出显示的。为了改进现有方法的性能,我们解释了结核分类中出现的不一致性。从基于统计和纹理的描述符中提取的特征被观察到具有重叠值。为了识别与恶性程度为1至5的候选结节的不一致性,对标记注释进行了详细研究。在解释某些病例时,同一候选结节区域可能由四名不同的放射科医生对同一CT扫描进行恶性程度评价,范围为1至5。范例:一个放射科医师将候选区域评估为恶性等级5,而其他放射科医师已经将相同的候选区域评估为恶性等级3和4,如图5所示。由于不正确的恶性肿瘤可疑性,将分割图像错误分类为良性或恶性样本导致总体表现出候选结节区域的假阳性分类的低性能准确性。为了克服这一局限性,通过考虑基于统计和纹理的描述符,手动执行结节分组以减少误分类。对纹理和统计特征值重叠的图像进行识别,并根据其恶性程度手动分割,将候选结节替换到相应的类别中此外,放射科医师在其对靠近肋骨、血管或胸壁的图像的审查中可能将一些候选区域假阳性地中的程序表53个LIDC数据集的性能指标。数据集类别图像具有多个级别结节数量结核总数DCNN的准确性精度传统手工制作方法D1良性1,22781279百分之九十三点四六91.10%恶性4,5432非癌–569D2良性1,2,3507150887.91%85.43%恶性4,5432非癌–569D3良性1,2278150871.90%68.86%恶性3,4,5661非癌–569S. Suresh,S.Mohan/ Journal of King Saud University1713表6使用Adam Optimizer测量DCNN架构性能。层数架构阿尔法内核大小精度时代20时代30时代40时代50时代1008十二,八,六0.1五,五,五0.9130.9190.9190.9340.9198十二,八,四0.1五,五,五0.9040.9060.9100.9140.9158十二,八,六0.1五五三0.9040.9060.9060.9110.9038十二,八,四0.1五五三0.8850.9100.9000.8990.92110十二八六四0.1五,五0.9150.9000.8990.9100.900表7使用Sgdm Optimizer测量DCNN架构性能。层数架构阿尔法内核大小精度时代20时代30时代40时代50时代1008十二,八,六0.1五,五,五0.8850.8900.8930.8990.8998十二,八,四0.1五,五,五0.8950.8980.8940.8930.8948十二,八,六0.1五五三0.8850.9050.8990.9040.9198十二,八,四0.1五五三0.8810.8830.8850.8850.88910十二八六40.1五,五0.8810.8900.8960.8850.889图五. 由4名放射科专家进行诊断。识别特征是耗时的,并且如果没有适当地考虑特征之间的相关性,则可能不能保证良好的结果。在大多数情况下,机器学习模型通过将“大小”考虑为区分良性或恶性的特性特征来评估结节,但不考虑结节模式的大变化。然而,在某些情况下,对结节大小的依赖导致将小的候选结节误分类为良性,将大的候选结节误分类为恶性。然而,很少有候选结节区域被真正肯定地认为是HMN,其被认为是真正肯定地被接受为LMN,如图6所示。类似地,图7代表了一些候选结节区域,这些区域被认为是真正积极的LMN,但应该以高概率被接受为HMN。因此,通过根据结节的模式和恶性程度对结节进行分组,总共70个错误分类的样本被潜在地识别并分阶段测试。此外,使用具有相同输入大小、层数(深度)、相同卷积滤波器的随机梯度下降(sgdm)优化器重复实验来训练DCNN,以评估其性能。结果表明,与Sgdm相比,Adam优化器的方法取得了良好的预期效果,如图所示。8.第八条。使用结节分组数据集观察到DCNN性能的一致改善,与初始数据集图像相比,分类准确度最高,为97.8%,如表8所示。此外,DCNN与传统的手工制作的方法相比,这两个数据集。此外,使用数据集强调了该方法,并将DCNN方法获得的结果与相关工作进行了比较,如表9所示。的准确比较根据de CarvalhoFilho等人(2018),Xie等人(2018 )和 Lakshmanaprabu等人的性能指标进行评估。(2019年)。与其他方法相比,所提出的DCNN算法在平衡数据集上实现了最高的准确性、灵敏度、特异性和ROC,从而实现了更好的结节分类,并降低了假阳性率。很少有方法使用较小的数据集,或者可能没有相等数量的图像样本这降低了比较的可靠性。对于性能评估,在研究中使用具有相等数量的图像样本的平衡增强图像数据集。改变训练和测试比率样本以查看算法是否产生如表10中所表示的一致行为。5. 结果和讨论所提出的方法评估了来自LIDC数据集的自动化端到端学习特征,用于肺癌诊断,根据恶性阶段对每个结节进行分类。从NROI中提取候选结节,并将其馈送到DCNN进行训练。在分类过程中观察到假阳性,这是由于对人体气道、血液1714S. Suresh,S.Mohan/ Journal of King Saud University见图6。图像假阳性接受为HMN。血管、肺树结节。为了减少假阳性,将10倍交叉验证和结节分组应用于图像数据集,形成两个部分:训练和测试折叠用于评估。在训练阶段,使用结节分组数据集观察到DCNN性能的持续改善,并且结节不仅通过将“大小”作为特征性特征进行分类总的准确性为97.8%,特异性为97.2%,敏感性为97.1%,AUC评分为0.9956用DCNN方法记录。相应的混淆矩阵和受试者工作特征曲线(ROC)曲线如图1A和1B所示。分别为10和11。由于深度学习算法执行端到端学习过程,因此传递的唯一输入是重新采样的ROI图像。然而,图像数据集的预处理在我们的研究中起着至关重要的作用,增强了结节的早期检测肺癌。深度结构化方案的预处理包括相同大小的输入数据和用于预处理数据集中的所有图像的可行过程。分割出的候选结节大小不同,具有关于结节形状及其周围环境的信息使用深度学习方案,S. Suresh,S.Mohan/ Journal of King Saud University1715见图7。图像假阳性接受为LMN。同时有效地提取了结核结构周围的信息及其形状和大小。因此,该算法检测不同的不规则结构的结节,包括孤立性结节,胸膜和近胸膜结节和血管结节具有高精度,并适用于大数据集。整个神经网络在支持CUDA的显卡上进行训练:Nvidia GeForce GTX 960,在台式机上使用Matlab 2018b版本,内存为8 GB,12(4C和8G)核AMD A10处理器,训练时间为GPU模式下的总时间复杂度为1.33 min,分类结果。6. 结论所提出的方法实现了DCNN,用于自动学习为肺结节分类提取的特征,减少了假阳性。本研究的分类准确率为97.8%,特异性为97.2%,敏感性为97.1%,1716S. Suresh,S.Mohan/ Journal of King Saud University见图8。 使用“Adam”和“Sgdm”优化器测试拟议方法表8在结核分组LIDC数据集上进行的实验。LIDC数据集方法分类准确性表10不同训练集和测试集的性能评估。训练集测试集结节数量准确度结果百分之六十五831百分之九十七点八百分之七十895百分之九十七点四三1279张图片75%959百分之九十七从LIDC80%1023百分之九十七点三数据集为85%1087百分之九十七点五二用于培训90%1151百分之九十六点九六百分之九十五1215百分之九十六点七初始数据集传统手工制作的功能91.10%DCNN 93.46%诺鲁分组数据集传统手工制作特征百分之九十五点四七DCNN 97.8%AUC评分为0.9956。结果表明,具有自学习功能的DCNN由于层的深度有限,DCNN表现出了潜在的特征学习能力,并且对不同大小的训练和测试数据集具有鲁棒性对今后的工作提出了以下意见。1. 虽然初步研究的结果令人鼓舞,但我们只对有限数量的深度学习层进行了测试。增加CNN方法中的层数可以提高诊断的性能,因为该方法类似于人脑结构。2. 深度学习算法的输入补丁的最佳大小有待进一步研究。见图9。 使用“亚当”优化器的建议方法的学习曲线3. 此外,还将从3D输入数据中提取特征来训练DCNN,即使这可能会导致更多的网络复杂性。4. 从输入补丁中提取基于上下文的特征(目前无法提取)的进步可以提高传统手工方法的效率。竞争利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作。表9与相关工作的结果比较。研究论文图像数据库图像数量精度特异性灵敏度ROCdeCarvalho Filho等人(2018年)LIDC1404个结节,394101192.63%百分之九十三点四七90.70%0.934Xie等人(2018年)Jiang等人(2018年)LIDCLIDC1972结核,64813241006次扫描89.53%–92.02%–84.19%80.6 FP为4.70.966–Xie等人(2019年)月球16150414张图片,––94,15.1 FP86.42–150075-Huang等人(2019年)月球16339888次CT扫描,91.4对于1个FP–––Lakshmanaprabu等人(2019年)LIDC223个结节70张图片,94.6 4 FP百分之九十四点五六百分之九十四点二百分之九十六点二–拟议方法LIDC正常良性恶性1279张图片,百分之九十七点八百分之九十七点二百分之九十七点一0.995278437第569节-第一次S. Suresh,S.Mohan/ Journal of King Saud University1717见图10。 提出的方法的混淆矩阵。见图11。 建议方法的ROC曲线。引用Armato , III , Samuel , G. , McLennan , G. , 比 多 湖 McNitt-Gray , Michael , F.Meyer,Charles R.,里夫斯,安东尼P,Clarke,Laurence P.,2015.癌症影像档案。数据来自lidc-idri。da Silva,G.L.,da Silva Neto,O.P.,席尔瓦,AC,de Paiva,A.C.,加塔斯,M.,2017. 基于进化卷积神经网络的肺结节诊断。多媒体工具应用76,19039-19055。de Carvalho Filho , A.O. , de Sampaio , W.B. , 席 尔 瓦 , AC , de Paiva , A.C. ,Nunes,R.A.,加塔斯,M.,2014.基于质量阈值聚类、遗传算法和多样性指数的孤立性肺结节自动检测。第内特尔 Med. 6 0 ,165-177。de Carvalho Filho,A.O.,席尔瓦,AC,de Paiva,A.C.,Nunes,R.A.,加塔斯,M.,2017. 应用系统发生多样性、遗传算法及支持向量机于电脑断层摄影中肺结节之电脑辅助诊断。J. Digital Imaging 30,812- 822.de Carvalho Filho,A.O.,席尔瓦,AC,de Paiva,A.C.,Nunes,R.A.,加塔斯,M.,2018. 应用CT对良恶性肿瘤分型的探讨基于拓扑的系统发育多样性指数和卷积神经网络。模式n。81,200-212。黄,X.,孙,W.,曾文L. B.,Li,C.,Qian,W.,2019.使用深度卷积神经网络对胸部ct扫描中的肺结节进行快速全自动检测和分割。Comput. Med. 成像图。Hyvärinen,A.,Oja,E.,2000.独立成分分析:算法与应用。神经网络13,411-430。雅各布 斯,C. van Rikxoort ,E.M. ,Twellmann ,T. ,Scholten , E.T. ,de Jong,P.A.,Kuhnigk,J.M.,Oudkerk,M.,de Koning,H.J.,Prokop,M.,Schaefer-Prokop,C.,例如,2014. 自动检测胸部计算机断层扫描图像中的亚实性肺结节。Med.图像肛门。18,374-384。雅各布斯,C. van Rikxoort,E.M.,墨菲,K.,Prokop,M.,Schaefer-Prokop,C.M., vanGinneken,B.,2016.肺结节的计算机辅助检测:使用公共lidc/idri数据库的比较研究。EUR.放射学26,2139- 2147。江,H.,妈妈,H.,Qian,W.,高,M.,李,Y.,20
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Java集合ArrayList实现字符串管理及效果展示
- 实现2D3D相机拾取射线的关键技术
- LiveLy-公寓管理门户:创新体验与技术实现
- 易语言打造的快捷禁止程序运行小工具
- Microgateway核心:实现配置和插件的主端口转发
- 掌握Java基本操作:增删查改入门代码详解
- Apache Tomcat 7.0.109 Windows版下载指南
- Qt实现文件系统浏览器界面设计与功能开发
- ReactJS新手实验:搭建与运行教程
- 探索生成艺术:几个月创意Processing实验
- Django框架下Cisco IOx平台实战开发案例源码解析
- 在Linux环境下配置Java版VTK开发环境
- 29街网上城市公司网站系统v1.0:企业建站全面解决方案
- WordPress CMB2插件的Suggest字段类型使用教程
- TCP协议实现的Java桌面聊天客户端应用
- ANR-WatchDog: 检测Android应用无响应并报告异常
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功