没有合适的资源?快使用搜索试试~ 我知道了~
沙特国王大学学报融合人工藻类算法的多模态深度学习-用于癌症预后预测的先进电子健康系统架构Summrina Kanwala,Faiza Khanb,Sultan Alamria,a沙特阿拉伯利雅得11673沙特电子大学计算和信息学系bRiphah International University,Faculty of Computing,Islamabad 45211,巴基斯坦阿提奇莱因福奥文章历史记录:2021年12月8日收到2022年2月15日修订2022年3月10日接受2022年3月25日在线提供保留字:癌症预后预测多模式数据人工藻类算法(AAA)DDQN(双深度Q网络)CNN-XGBOOST(卷积超梯度提升)卷积支持向量机强化学习A B S T R A C T当癌症影响重要器官及其功能潜力时,它会危及生命;因此,早期发现对于预后管理至关重要。医学研究受益于人工智能(AI)技术的快速发展,特别是机器学习(ML)、深度学习(DL)和增强学习(RL),这导致了用于改善癌症预测和生存分析的几种方法和技术的发展。为了改善癌症预后预测和生存分析,提出了一种新的框架,该框架通过使用DL和RL的早期和晚期融合技术来融合多模态特征。该方法利用人工藻类算法(AAA)从数据集中提取最具弹性的通过使用AAA从各种数据模式中提取有价值的特征来说明这种技术的独特性,这些数据使用公开可用的数据集评估了所提出的框架的有效性:脑中低级别胶质瘤(BRAIN-TCGA),前列腺癌,膀胱癌,转移性结直肠癌(MSKCC)和METABRIC数据集。BRAIN-TCGA数据集达到的最佳准确度为0.99,超过了各种最性能评估结果表明,该模型优于目前可用的癌症预后预测模型在预测性能方面。©2022作者(S)。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍癌症患者可以从能够准确地预测其预后中受益匪浅,并且从业者可以通过能够及时做出判断并提出适当的治疗方案而受益。对于从业人员来说,癌症预后分析是其职业的重要组成部分,特别是在处理生存时间短的患者时。癌症预后的预测被从业者广泛用于做出临床决策,确定治疗方案的资格,*通讯作者。电子邮件地址:S. seu.edu.sa(S. Kanwal),Salamri@seu.edu.sa(S. Alamri)。沙特国王大学负责同行审查开发和分析临床研究。临床医生还可以向患者提供并提供机会来选择他们是否希望得到护理,并且如果他们面临短期生存的前景,则为他们提供一些时间来考虑一些实际行动以准备死亡(Sun等人, 2018年)。本研究的目的是通过建立一种更准确的检测/预测癌症患者的方法来帮助从业者。受到研究协会的大量工作的启发,本文介绍了最先进的DL和RL架构,针对癌症生存分析进行了优化,并经过制作和主办:Elsevierhttps://doi.org/10.1016/j.jksuci.2022.03.0111319-1578/©2022作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.comS. Kanwal,F.Khan和S.Alamri沙特国王大学学报2708开放源代码和公众可访问的多模式数据。简而言之,本研究做出了以下重大贡献一种新的癌症生存预测框架,将DL/ML和RL方法与AAA整合为FS方法,以使用多模态数据改善癌症预后预测。早期和晚期融合技术的应用,以提高框架的预测能力。一组不同的多模态数据集的应用所提出的新框架。前列腺癌数据集、转移性结直肠癌数据集(MSKCC)和膀胱癌数据集(BLADDER-TCGA)首次被用于使用多模式方法进行癌症生存预测。与使用相同癌症数据集的其他最先进ML/DL技术以及其他最先进FS技术的比较。其余的文件结构如下:第二节提供了一个深入的概述,以前的研究,已经完成了在一个特定的疾病或相关的AAA算法;第三节提出了实施所提出的方法和技术已被使用;第四节描述了实验工作;和第五节分析,讨论的调查结果和结果,从技术已实施。第六节提出了结论和对未来研究工作的建议。2. 文献综述近年来已经提出了几种利用多模态数据预测癌症预后的技术。Sun等人(2018)通过将多维数据用于乳腺癌预后预测,提出了一种多模态深度神经网络(DNN),并报告说,所建议的技术优于仅使用一维数据的预测方法以及其他当前方法。Ding和Peng(2005)提 出 并 在 六 个 基 因 表 达 数 据 集 上 测 试 了 最 小 冗余 最 大 相 关 性(MRMR)特征选择模型:NCI、淋巴瘤、肺、儿童白血病、白血病 以 及 结 肠 。 本 研 究 采 用 朴 素 贝 叶 斯 ( NB ) 、 支 持 向 量 机(SVM)、线性判别分析(LDA)和逻辑回归(LR)分类算法。Cheerla和Gevaert(2019)建议利用临床数据以及mRNA表达数据,除了该microRNA表达数据,以及组织病理学全载玻片图像(WSI),还提出并讨论了一种基于多模式神经网络的方法编码算法针对每个数据源进行了个性化处理,深度高速公路网络从临床和基因组数据中提取特征,CNN从WSI中Liang等人(2014)提出了另一种多模态深度信念网络(DBN)模型,用于合并多平台基因组数据集以及临床数据集,这些数据集主要以各种形式存在,例如实值、二进制和分类值,不仅如此,它们还具有不同的统计特性,用于分析癌症数据集和疾病亚型识别。实验在两组癌症相关数据上进行 : 一 组 是 卵 巢 癌 数 据 集 , 而 第 二 组是 乳 腺 癌 相 关 数 据 集 。(Nedelcu等人,)已经应用了在多模态数据上训练的深度卷积神经网络(CNN)来诊断皮肤病变,所述多模态数据具体为宏观和皮肤镜图像和元数据。该研究还在可比较的数据集上使用了迁移学习,例如用于预测各种皮肤疾病的Escort,ISIC 2019和Deromfit。通过对来自相关领域的数据集进行预训练,网络学习相关知识。显著增强网络性能的Evant属性。据观察,宏观图像的准确度最低,因为临床图像提供的特征少于皮肤镜图像,尽管7点检查列表的分类得到改善,但元数据并未提高诊断准确度。总的来说,与直接分类相比,诊断有所改善。Sun等人(2021)提出了一种基于3D全卷积网络和多通道设计的多模态MRI图像特征提取模型。该模型在脑肿瘤分割数据集BraTS 2019和2018上进行了测试,得到了准确的分割。Daza等人(2020)提出了一种用于肺癌预测的DNN技术,该技术整合了视觉和临床数据以及肺癌筛查数据集(LUCAS)。得出的结论是,多模态基线优于系统的两个单一模态Subramanian等人(2020)使用CT扫描(放射学)和RNA测序(基因组学)的基因表达数据的多模式融合来预测非小细胞肺癌(NSCLC)的术后复发本文采用带调节的线性Cox比例风险模型和神经网络有人指出,这些多种模式在各种情况下都有更好的表现,没有一种方法在所有方面都优于其他然而,人们发现,当在有限的数据集上训练时,NN方法更难以推广。Yan等人(2021)提出了一种新的、更强大的融合网络,用于使用病理图像和结构化EMR数据进行乳腺癌分类在PathoEMR(Patho-logical EMR)数据集上,采用去噪自动编码器,平均分类准确率为92.9%。 Ali等(2019)开发了一种自主乳腺癌诊断模型,该模型利用了传统机器学习技术的组合,包括LDA和DL技术,如完全连接的CNN ResNet50。此外,ResNet50网络已被用作ML的特征提取器和直接分类的模型随后,通过使用基于图像的数据集对ResNet50网络进行了微调,结果微调后的ResNet50网络的平均灵敏度为86.23% Zhanget al.(2021)提出了一种DNN,用于使用五种不同的数据集对NSCLC患者进行预后预测。采用了一种基于CNN的特征修改方法,同时考虑了组学数据的所有特征以及抽象概念。使用这些表示法预测NSCLC患者的5年生存率,AUC值在0.8163-0.8508范围内Vale-Silva和Rohr(2021)介绍了MultiSurv,这是一种基于DL的多模式和离散时间MultiSurv应用于33种不同形式的癌症,使用六种不同的数据输入模式。研究人员将MultiSurv与过去的方法进行了定量比较,其中包括基于CPH和DL的技术。据观察,MultiSurv获得了单峰数据的峰值性能,这是进一步增强了多模态数据的集成Ghoniem等人(2021)使用多模态数据研究了一种混合进化DL模型,该模型由预测蚁群优化的长短期记忆(LSTM)模型和蚁群优化的CNN模型构建。采用不同的进化技术,将该模型与已有的9种多模态融合模型进行了比较。结论:建议的方法是更具体和准确的诊断卵巢癌。在过去,研究人员专注于特定的癌症数据集,错过了发现不同组织和器官中癌症虽然以前的研究使用单峰数据,但没有一个使用早期融合,●●●●●S. Kanwal,F.Khan和S.Alamri沙特国王大学学报2709不XttE将其与癌症存活分析的晚期融合范例进行比较。本研究旨在通过对这方面的研究进行实验来填补这一研究空白3. 背景在本节中,提供了实验中使用的各种方法的简要描述实验使用深度RL和DL结合AAA进行3.1. 双深度Q-NETWORK(DDQN)与DNN一起使用的双Q学习(DQN)称为DDQN。DDQN利用DQN通过将目标内的最大运算分解为动作选择和动作评估的最大运算来减少高估这里,贪婪策略根据Q网络进行评估,并使用该目标网络估计值。更新设置为与DQN然而,目标YDQN被替换为:YDDQN¼Rt1CQ.St1;argmaxQSt1;a;ht;h-1与实际创建的DQN相比,在DDQN中,其他一些网络h0t的权重随着目标网络h-t的权重而改变评估当前贪婪政策的权重(VanHasselt等人,2016; Sewak,2019)。3.2. 卷积神经网络(CNN)下面的等式提供了CNN过程的数学公式,其中W和b分别表示权重和偏差。CNN的S形激活函数表示为Eq. (2)到下面的(6)(Dewa和Afiahayati,2018;Vidhya,2021)进行二元分类。Sigmoid函数fx1=1e-x2Z1¼xωf3A¼SigmoidZ14Z2¼W:Ab5输出¼Sigmoid转换器Z2转换器6转换器3.3. 支持向量机设{x 1,x 2,.. . ,xn}是具有对应标签的特征向量,y ie{0,1},则SVM 超平面方程可以写为如下(Wiering 和Schomaker , 2014;Nadira和Ruhlane,2018; Ali等人,2017; Kanwal,2016):fxwxib<$07其中w是2-D权重向量(Khan等人, 2020年)。3.4. 极限梯度提升(XGBoost)XGBoost分类器使用K个分类和回归树(CART)的联合,每个CART具有Kijis1···K个节点。最后一个预测是每个树的预测得分的总和:K·i<$O`K-1其中,xi=训练集成员,yi =一致类标签,fk =第k棵树的叶得分,F =所有CART的K个得分集(Thongsuwan等人,2021; Liew等人, 2021年)。3.5. CNN与XGBoost和SVM使用CNN提取的特征通过使用XGBoost和SVM分类器进行训练和测试。3.6. 人工藻类算法在2015年,Uymaz等人(2015)介绍了AAA,一种生物启发的Meta启发式优化方法,用于解决连续和实值优化问题。这是微藻搜索行为的灵感来源在这种基于种群的方法中,每个个体被认为是一个人工藻类群落(AAC),并且每个AAC类似于问题空间中的解决方案当人造藻类以与实际藻类相同的方式迁移到光源时,会发生更有效的光合作用。它们的运输方式是螺旋游泳。它们的生命周期包括环境适应,改变优势物种和有丝分裂繁殖(Kocer和Uymaz,2018)。AAA有三个阶段:进化/繁殖阶段,螺旋运动阶段和适应阶段。在自然界中,如果环境中有足够的营养和光供应,则进化/繁殖阶段用于通过有丝分裂使任何藻类复活来补充群落适应阶段用于将藻类群体与环境整合。如果一些藻类在适应阶段无法在大气中生长,它们就会藻类的运动称为螺旋运动。藻类种群存在于液体大气层中,并且聚集在非常靠近液体表面的地方,在那里它们有足够的藻类细胞利用它们的鞭毛(一种用于运动的细胞器)进行螺旋运动。AAA算法的流程图如图1所示,AAA伪码如图2所示(Uymaz等人,2015; Turkoglu和Kaya,2020; Kumar等人,; Kumar和Dhillon,2017年)。3.7. 数据集以下数据集已被用于验证所提出的框架。3.7.1. METABRIC数据集该数据库包括从METABRIC实验中患有乳腺癌的1046名患者收集的数据(Curtis等人,2012),包括与乳腺癌相关的多模态数据,如基因表达谱、CNA谱,以及临床数据或信息。确诊或检查时平均年龄61岁,平均生存期125.1个月。如果患者存活少于5年,则将患者分类为短期存活者(类别标签0),如果患者存活>5年,则将患者分类为长期存活者(类别标签1)(Sun等人,2018年)。METABRIC数据集的属性如下表1所示。3.7.2. 前列腺癌数据集这些数据来自1034名不同国籍的有效前列腺癌患者。它包括多模态信息,包括临床数据和CNA配置文件。患者的生命状态用作类别标签,0 表 示 死 亡 , 1 表 示 存 活 。 该 数 据 集 可 在 www.example.comwww.example.com上找到https://www.cbiopor-tal.org/study/cnSegments? id=prad_msk_stopsack_2021。前列腺癌数据集的特性示于下表2中。S. Kanwal,F.Khan和S.Alamri沙特国王大学学报27103.7.3. 脑癌数据集(BRAIN-TCGA)这些数据来自241名不同种族的癌症患者。这包括多模态信息,如临床数据、CNA谱和RNA。如果患者存活少于5年,则将其归类为短期存活者(类别标签0),否则归类为长期存活者(类别标签1 ) 。该 数 据 集 可 在 www.example.com 上 找 到https://www.cbioportal.org/study/summary? id=lgg_tcga。脑癌数据集的性质示于下表3中。3.7.4. 膀胱癌数据集(BLADDER-TCGA)这些数据来自476名不同种族的癌症患者。临床数据包括许多属性,其中>50%患者的大多数属性缺失值,因此仅考虑13个属性的精密度。这包括多模态信息,例如临床数据、CNA谱和RNA。患者的生命状态用作类别标签,0表示死亡,1表示存活。 该数据集可在https://www.example.comwww.cbioportal.org/study/summary?id=blca_msk_tcga_2020。给定数据集的属性已在下面的表4中示出。3.7.5. 转移性结直肠癌数据集(MSKCC)这些数据来自1099名癌症患者。在临床数据中,只有25个质量被考虑用于进行预测,因为超过一半的患者在这些特征上有缺失值。这包括多模态信息,例如临床数据、CNA概况。患者的生命状态用作分类标签,0表示死亡,1表示存活患者。该数据集可在www.example.com上找到https://www.cbioportal.org/study/clinicalData?id=crc_msk_2017。数据集的属性如下表5所示。Fig. 1. AAA流程图图二. AAA的伪代码S. Kanwal,F.Khan和S.Alamri沙特国王大学学报2711¼N--4. 方法使 用 AAA 选 择 的 一 组 弹 性 特 征 被 馈 送 到 DQN , DCGAN ,XGBoost技术(它们中的每一个都在进行不同的实验时被应用所提出的方法的总体过程在图3中描绘。该过程包括以下步骤:第一步:数据归一化:在第一步中,对数据进行清理以去除所有噪声和缺失数据,并使用相关数据填充缺失数字。在数据清理之后,将数据标准化为值0和1以提高分类器归一化方程为:表5脑癌数据集的属性。数据集的属性数据类型编号已选功能临床25 21基因表达拷贝数1134 3001. 答:首先,藻类群体是随意创造的。2. 适应度计算:DQN、DCGAN、XGBoost等分类算法的性能被用作适应度函数。x0x-xminxmax-xmin其中x0 =变量x的归一化值,xmin =数据集中的最小数据点。ð9Þ第10节在这个阶段中,DQN,DCGAN,XGBoost算法的性能在训练数据上进行评估。由此产生的精度被认为是个人的适应值。这些分类器的参数在下面的表6中给出3. 更新:藻类菌落的位置更新,呈现以下等式:xmax=数据集中的最高数据点(Mumtaz等人, 2021年)。第二步:数据分类:数据预处理后,f¼accXN1/1access访问xi10位数据集的数字特征(基数特征)也被转换成数字形式。步骤3:AAA作为特征选择(FS):在数据转换之后,AAA被用作FS,其步骤在下面详细描述(Kumar等人; Kumar和Dhillon,2017年)。表1METABRIMETABRIC数据集的属性。数据集属性数据类型编号特征选定编号临床数据27 25基因表达基础24,368 300基于拷贝数表2前列腺癌的治疗数据集属性数据类型编号特征选定编号临床20 17基因表达中值其中,在正确分类和访问的情况下,access(xi)= 1(xi)= 0表示不正确的分类,f=适应度函数,acc(X)=数据集的分类精度,X=(x1,x2,x3,,,xN),由N组成具有类标签Y=(y1,y2,x3,,xN)的特征。AUC 和MCC 是报告结果时考虑的其他指标受试者操作特征(ROC)是一个二维图,说明了收益(TP)和成本(FP)之间的比较权衡。在ROC中,FP率显示在X轴上,ROC曲线下面积缩写为AUC(Kanwal,2017),被认为是可用于预测ROC性能的单个数字。由于AUC是在单位正方形的面积上计算的,因此AUC的值范围为0至1.0。AUC值为0.5表明预测是通过随机猜测进行的。对于二元分类,MCC识别实际值和预测值之间的关系。其值范围为1到+1,+1表示极好的预测,1表示两个值之间完全不一致。值为0表示预测不比随机好其他可用的指标有灵敏度、特异性、F1评分等。我们选择AUC和准确性作为主要指标,因为这些是最常用的医疗决策指标,我们打算将拟议的框架与文献中的其他方法,其中大多数提供他们的结果在准确度或AUC方面。表3脑癌数据集的属性。表4脑癌数据集的属性。4. 循环:重复该过程,直到一旦为特定分类器选择了所需数量的特征,则所有这些模型都将被验证,并且在此之后,avg。实现了精确度和准确度步骤4:使用早期和晚期融合的分类(单峰和多峰):所提出的生存分析框架研究了两种融合方法:早期融合以在分类之前整合特征,晚期融合以组合分类结果(Ebersbach等人, 2017年)。1. 早期融合:早期融合也称为“数据级融合”,是在特征级上进行的.在这种情况下,来自多个模态的特征向量被合并成单个大特征向量,该单个大特征向量随后被用于分类过程。由于该载体包含多种特征,P数据集属性数据类型Number特征选择编号临床2017基因表达中值拷贝数-18 415人16,381400300数据集的属性数据类型Number选择的功能临床1313基因表达20,532400拷贝数29,097300S. Kanwal,F.Khan和S.Alamri沙特国王大学学报2712图三. 拟议的框架。培训和叙级时间也将得到加强。然而,一个大规模的特征向量与适当的学习算法同时发生,最终可以导致显著优越的性能(Ebersbach等人,2017; Sehar等人,2021年)。早期融合模型是基本的CNN-XGBOOST模型,包括所有临床、CNA、RNA特征以及来自CNN-XGBOOST模型的学习特征表示的级联(Huang et al.,2020;Wang等人,2021年)。这些特征被用作DL分类器的输入。早期融合方法如图所示。 四、2. 后期融合:也称为“决策级融合”,具体说明分类后对结果输出的整合。该策略通过评估开发的分类器的单个标签或分数来预测最终结果(Ebersbach等人,2017; Sehar等人,2021年)。在这种情况下,每个模态被单独建模,并使用上面指示的分类器进行分类。为了实现最终的决定,局部预测进一步整合使用参数化方程。图5描绘了MDCNN-XGBOOST(多维CNN-XGBOOST)技术的构建。CNN-XGBOOST模型使用每个模态数据进行训练。然后,与所提出的技术,从每个单独的模型进行评分级融合。基于加权线性聚合的MDCNN-XGBOOST的集体输出计算如下:aMDCNN-XGBOOST<$aωaCNNXGBOOST-RNA<$bωaCNNXGBOOST-CNA<$cωaCNNXGBOOST-临床应用s:t:a≤b≤c≤1;a≥ 0;b≥ 0;c≥ 0其中参数a、b、c已知是用于稳定每个CNN-XGBOOST模型的输入的三个权重系数。使用验证集和AAA方法,MDCNN-XGBOOST基于最适合的预测制定来确定子CNN-XGBOOST模型的最佳参数α、β和γ。对于所有三个数据集,使用AAA确定的最终最佳值为a= 0.3,b= 0.1和c=0.6。MDCNN-XGBOOST算法是使用Ten- sorFlow 1.0 DL库实现的,由于它是一个开源软件库(Sun等人,2018年; Xu等人,2016年)。实验在GoogleColab Pro GPU上进行。5. 结果和讨论我们将上述方法应用于多模态数据集来预测生存机会。结果在下表7为了避免过拟合现象,将数据集分为两部分:70%用于数据模型训练,30%用于评估AAA-CNN-XGBOOST的分类准确性(AAA 作为FS与CNN-XGBOOST),AAA-CNN-SVM(AAA作为FS,使用CNN-SVM)和DDQN(AAA作为FS,使用DDQN)。实验采用不同的时期计数进行(Cheerla和Gevaert,2019;Liang等人, 2014; Nedelcu等人; Sun等人,2021; Daza等人,2020;Subramanian等人,2020;Yan等人,2021; Ali等人,2019年; Zhang等人,2021; Vale-Silva和Rohr,2021; Ghoniem等人,2021; VanHasselt等人,2016年; Sewak,2019年; Dewa和Afiahayati,2018年;Vidhya,2021年;Wiering和Schomaker,2014年; Nadira和Rujiak,2018年; Khan例如,2020; Thongsuwan等人,2021; Liew等人,小行星2021例如,2015; Turkoglu和Kaya,2020; Kocer和Uymaz,2018;Curtis 等 人 , 2012; Ebersbach 等 人 , 2017; Huang 等 人 ,2020;Kumar等人,; Kumar和Dhillon,2017; Xu等人,2016年;王例如,2021; Chaddad等人,2019年; Sun等人,2019; Ali等人,2017; Sehar等人,2021; Kanwal,2016; Mumtaz等人,二零二一年;Statistics Solutions,2013; Kanwal,2017)。表6包含有关DDQN、CNN-XGBOOST和CNN-SVM参数的详细信息。实验中使用了100个epoch,测试结果表明,由于FS的存在,AAA获得了更高的预测精度。表6中所示的结果表明,当使用选定的特征时,预测算法需要有限的时间进行训练。深度学习技术所需的时间与数据集的大小和所采用的层的数量成比例;因此,可训练参数的数量。通过选择稳健的特征来减少训练时间,有助于保持或提高相同的性能水平。表7总结了具有和不具有FS的DL/ML和 RL算法在10倍交叉测试中的平均性能。S. Kanwal,F.Khan和S.Alamri沙特国王大学学报表27132713实验中给出了dL方法的参数设置、待训练参数和每个数据集的处理时间数据集分类器初始学习率批量/时期数激活函数数据模态不带FS的可训练参数FS的可训练参数数量不包括FS的培训时间FS的培训脑-TCGACNN-XGBOOST0.0001100/100LeakyReLU临床70,14441,6323.4毫秒2.4毫秒CNA67,031,5521,167,8721秒3.7毫秒1秒1.5毫秒RNA75,354,6241,205,1531秒3.26毫秒1秒2.2毫秒CNN SVM0.0001100/100LeakyReLU临床70,14441,6323.2 ms2.2毫秒CNA67,031,5521,167,8721秒3.6毫秒1秒1.0毫秒RNA75,354,6241,205,1531秒3.26毫秒1秒2.2毫秒DDQN1e-3100/100临床74,7545,9545s56ms3s66msCNA1,052,73823,5548秒12毫秒3秒41毫秒RNA1,182,85023,55410秒12毫秒5秒6ms前列腺癌CNN-XGBOOST0.0001100/100LeakyReLU临床70,14449,6321秒2.6毫秒1秒1.4毫秒CNA2,150,9121,167,8721秒4.6毫秒1秒1.0毫秒CNN SVM0.0001100/100LeakyReLURNA临床–70,144–49,632–2.56毫秒–1秒2.1毫秒CNA2,150,9121,167,8721秒4.7毫秒1秒1.5毫秒DDQN1e-3100/100RNA临床–69,63468,21256毫秒6秒10毫秒4s20msCNA69,89068,71212秒56毫秒8秒10毫秒RNA––––METABRICCNN-XGBOOST0.0001100/100LeakyReLU临床4,260,35470,4013.3毫秒3.2 msCNA67,031,55265,03150s56ms30s3msRNA67,031,55266,06452秒54毫秒35s2msCNN SVM0.0001100/100LeakyReLU临床4,260,35470,4013.2 ms3.2 msCNA67,031,5523,423,44650s60ms40s40msRNA67,031,5522,345,60452s53ms52s4msDDQN1e-3100/100临床72,96272,9621分23秒1分15秒CNA4,260,354143,3622分43秒1分50秒RNA4,259,842143,3621分45秒46s34ms公司简介CNN-XGBOOST0.0001100/100LeakyReLU临床66,27366,2733.3毫秒3.3毫秒CNA238,289,3763,244,7691s20ms1.67毫秒RNA168,166,1132,425,5691s26ms1.1毫秒CNN SVM0.0001100/100LeakyReLU临床66,27366,2733.3毫秒3.3毫秒CNA238,289,3763,244,7691秒23毫秒1.65毫秒RNA168,166,1132,425,5691s24ms1.0 MsDDQN1e-3100/100临床69,89069,6225se35ms5秒30毫秒CNA4,120,454443,36210se45ms6se41msRNA4,348,648362,5779se35ms4se66msMSKCCCNN-XGBOOST0.0001100/100LeakyReLU临床164,577131,8094.3毫秒4.1 msCNA238,289,3763,244,7691s20ms1.67毫秒CNN SVM0.0001100/100LeakyReLU–临床–66,273–131,809–3.3毫秒–3.3毫秒CNA236,678,6843,345,2341.5sec45ms1.44毫秒DDQN1e-3100/100RNA临床-72,706-71,938-9se45ms-9秒25毫秒CNA4,320,726346,64412秒56毫秒8se51msRNA––––S. Kanwal,F.Khan和S.Alamri沙特国王大学学报表27142714见图4。早期融合或数据级融合。图五. MDCNN-XGBOOST模型用于S. Kanwal,F.Khan和S.Alamri沙特国王大学学报表27152715RL、dl和ml技术在fs前后的准确度和精密度方面的结果,每个数据集的训练集为95%置信区间。脑-TCGA简单的算法算法与FS模态95% CI精度AUCMCC95% CI精度AUCMCCCNN-XGBOOST临床0.69 0.012 ±0.680.6910.6650.740.0270.730.7230.702CNA0.97 0.020 ±0.9750.9710.9740.98 0.010 ±0.990.9890.986RNA0.900.0240.890.880.8690.99 0.010 ±0.990.9810.971CNN-SVM临床0.69 0.025 ±0.670.6720.6610.71 0.013 ±0.720.7130.701CNA0.870.0330.8610.8580.8760.91 0.020 ±0.900.8910.876RNA0.78 0.016 ±0.760.7430.7490.88 0.030 ±0.870.8610.839DDQN临床0.600.0410.5880.5760.5600.670.0170.650.6440.634CNA0.470.0240.4560.470. 4140.51 0.014 ±0.500.5220.513RNA0.580.0310.5410.5610.51830.570.0310.560.5610.547前列腺癌Simple算法特征选择生存95% CI准确度AUCMCC95% CI精度AUCMCCCNN-XGBOOST临床0.73 0.015 ±0.74 0.7120.7170.740.0230.770.7610.743CNA0.900.0230.89 0.900.8950.920.0310.910.9100.889RNA–––––––CNN-SVM临床0.750.0270.74 0.7250.7160.77 0.014 ±0.760.7520.742CNA0.75 0.016 ±0.73 0.7220.7190.77 0.025 ±0.760.7510.745RNA–––––––DDQN临床0.58 0.028 ±0.56 0.5760.5480.630.0210.6010.5910.565CNA0.57 0.014 ±0.56 0.5540.5330.59 0.011 ±0.5810.5900.577RNA––––––METABRICSimple算法特征选择生存95% CI准确度AUCMCC95% CI精度AUCMCCCNN-XGBOOST临床0.89 0.022平方米0.88 0.8710.8750.91 0.013 ±0.900.910.893CNA0.910.0410.89 0.900.8920.95 0.015 ±0.940.9500.936RNA0.810.0330.83 0.820.8210.84 0.011 ±0.830.8220.815CNN-SVM临床0.900.0410.88 0.8670.8700.91 0.013 ±0.900.9210.909CNA0.750.0230.73 0.7220.7130.740.0230.750.7410.732RNA0.85 0.030 ±0.87 0.8820.8710.860.0210.8710.8630.851DDQN临床0.880.0310.87 0.9100.9010.910.0210.920.900.890CNA0.630.0330.61 0.630.5830.650.0360.650.6350.617RNA0.590.0610.57 0.5820.5600.640.0170.610.6300.611公司简介简单算法带有特征选择的模态95% CI精度AUCMCC95% CI精度AUCMCCCNN-XGBOOST临床0.680.0320.670.6770.6690.700.0270.6910.6900.681CNA0.610.0360.590.5710.5620.62 0.010 ±0.6100.6010.590RNA0.60 0.015 ±0.580.5760.5750.610.0210.5910.5810.572CNN-SVM临床0.590.0440.580.5620.5610.608 ± 0.020.6730.6670.658CNA0.58 0.011 ±0.5710.5610.5700.62 0.020 ±0.6130.6220.606RNA0.580.0410.5670.5430.5390.595 ± 0.060.5730.5610.564DDQN临床0.63 0.016 ±0.6210.6110.6030.650.0310.6450.6500.634CNA0.60 0.054 ±0.5910.5780. 5640.61 0.052平方米0.6010.6210.593RNA0.591 ± 0.030.5840.5770.57180.612 ± 0.0450.6050.5910.587MSKCC模态95% CISimple算法准确度AUCMCC特征选择95% CI精度AUCMCCCNN-XGBOOST临床0.75 0.025 ±0.74 0.7350.7220.77 0.018 ±0.760.7530.733CNA0.66 0.011 ±0.652 0.6510.6410.680.0330.690.6820.676RNA–––––––CNN-SVM临床0.670.0410.68 0.6750.6700.700.0270.710.7010.699CNA0.64 0.025 ±0.631 0.6210.6010.72 0.060 ±0.710.7010.697RNA–––––––DDQN临床0.690.0330.688 0.6760.6600.710.0210.710.6980.688CNA0.65 0.051 ±0.643 0.6370. 6270.67 0.030 ±0.660.6520.643RNA–––––––验证。使用CNN-XGBOOST,实现了97.5%的准确度、0.974的MCC值和0.974的AUC值(BRAIN-TCGA数据集中的CNA数据)。使用AAA-CNN-XGBOOST技术将该准确度提高至99%(AUC = 0.989,MCC = 0.986)。AAA-CNN-SVM技术产生了有希望的结果,准确度为90%,AUC值为0.91,MCC为0.88,而DDQN技术产生的结果最不显著。同样,在前列腺癌的情况下,CNN-XGBOOST获得了最高的结果,准确度为89%,AUC为0.90,CNA数据的MCC值为0.895。AAA-CNN-XGBOOST用于改善这些结果,实现了91%的准确度和0.910或MCC和AUC值。对于临床数据,AAA准确性的最佳评分为77%,AUC值为0.761
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 十种常见电感线圈电感量计算公式详解
- 军用车辆:CAN总线的集成与优势
- CAN总线在汽车智能换档系统中的作用与实现
- CAN总线数据超载问题及解决策略
- 汽车车身系统CAN总线设计与应用
- SAP企业需求深度剖析:财务会计与供应链的关键流程与改进策略
- CAN总线在发动机电控系统中的通信设计实践
- Spring与iBATIS整合:快速开发与比较分析
- CAN总线驱动的整车管理系统硬件设计详解
- CAN总线通讯智能节点设计与实现
- DSP实现电动汽车CAN总线通讯技术
- CAN协议网关设计:自动位速率检测与互连
- Xcode免证书调试iPad程序开发指南
- 分布式数据库查询优化算法探讨
- Win7安装VC++6.0完全指南:解决兼容性与Office冲突
- MFC实现学生信息管理系统:登录与数据库操作
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功