融合Fisher评分和贪婪搜索的特征选择用于早期阿尔茨海默氏病检测

96 浏览量更新于2024-01-16 收藏 1.16MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

沙特国王大学学报融合Fisher评分和贪婪搜索的特征选择用于阿尔茨海默Alummed Niyas K.P.，蒂亚加拉詹山口⇑泰米尔纳德邦中央大学计算机科学系，印度Thiruvarur阿提奇莱因福奥文章历史记录：收到2020年2020年12月16日修订2020年12月16日接受2021年1月1日上线保留字：Fisher评分轻度认知障碍阿尔茨海默氏特征选择A B S T R A C T阿尔茨海默病（Alzheimer但是，在认知障碍的早期阶段，通过适当的治疗可以减少疾病的进展。本研究的主要目的是实现一个有效的特征选择算法，用于检测阿尔茨海默氏在本文中，我们提出了一个有效的融合Fisher评分排名和贪婪搜索启发式的特征选择标准阿尔茨海默氏所提出的算法提供了一个平衡的分类准确率为90%和91%，多曲线下面积为0.97，0.98，分别使用支持向量机，K-最近邻分类正常对照，轻度认知障碍，阿尔茨海默氏症此外，该算法还提供了更好的灵敏度，特异性为84%，82.5%，使用支持向量机，K-最近邻的轻度认知障碍的二进制分类，和阿尔茨海默氏症患者的澳大利亚成像和生物标志物生活方式数据集也。我们的研究结果表明，所提出的方法与有效的特征选择是有前途的，可以优于最先进的方法早期检测阿尔茨海默©2020作者由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍阿尔茨海默氏症被认为是老年人群中最致命的神经退行性疾病（阿尔茨海默氏症协会，2019; Ferrari等人，2018; Eldholm等人，2018年）。该疾病在全世界发展中国家和发达国家的老年人中的患病率都很高（Eldholm等人，2018;Matthews等人，2019; Pan和Nicolazzo，2018; Winblad等人，2016; Tsoy等人， 2019年）。根据《2019年世界痴呆症报告》，估计全世界有超过5000万人患有痴呆症，相当于韩国或西班牙的人口规模（ Wortmann ， 2012;Lorenz等人，2019年）。此外，据估计，到2050年，阿尔茨海默氏症的全球患病率*通讯作者。电子邮件地址：www.example.comthiyagu.phd @ gmail.com（ThiyagarajanP.）。沙特国王大学负责同行审查导致阿尔茨海默病发生的确切参数尚不清楚。然而，研究人员在寻找阿尔茨海默病的原因和起因方面进行了广泛的实验，但无法概括导致阿尔茨海默病（AD）的参数（Petersen等人，1999年）。然而，存在许多负责认知功能的脑的局部和全局参数，个体的脑脊液（CSF）可以用作生物标志物（Zimmermann等人，2018年）。这些特征可以使用先进的脑图像采集技术如磁共振成像（MRI）、正电子发射断层扫描（PET）、功能磁共振成像（fMRI）来发现。许多神经心理学评估测试，如简易精神状态检查（MMSE）、临床痴呆评定（CDR）、阿尔茨海默病认知评估量表（ADAS-Cog）也用于鉴定AD 患者（ Kurlowicz 和 Wallace ， 1999; Salmon 和 Bondi ，2009）。使用这些技术可以追踪大脑结构然而，医生在预测AD患者时将面临困难，因为这些生物标志物变化难以概括（Zimmermann等人， 2018年）。在这种情况下，使用各种多模态特征训练的机器学习（ML ）模型可以用于预测AD （ Zhang et al. ， 2012; Zhang 和Shen，2011）。https://doi.org/10.1016/j.jksuci.2020.12.0091319-1578/©2020作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。制作和主办：Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页：www.sciencedirect.comAlummed Niyas K.P.和Thiyagarajan P.沙特国王大学学报4994通常情况下，当病人怀疑自己的认知能力时，他或她会去看医生。所有去看医生的病人将来都不一定会转变为老年痴呆症。在这种情况下，医生的任务是在基线阶段预测未来的AD患者。这样的预测在减少不必要的医疗费用方面非常有用。此外，在检测的早期阶段可以有效地降低AD的进展速度。换句话说，如果医生能在疾病的早期阶段发现AD患者。然后，医生可以为他们设计有效的药物治疗策略（Kira和Rendell，1992）。还需要注意的是，在预测的早期阶段（在患者首次就诊期间的某个地方），治疗是有效的（Kira和Rendell，1992）。由于负责AD患者的确切参数是未知的，因此ML算法的基于特征选择的方法可能是有用的（Kira和Rendell，1992）。本文基于Fisher评分（FS）排序标准和贪婪搜索策略的融合，对阿尔茨海默病神经影像学倡议-TADPOLE（ADNI-TADPOLE）和澳大利亚影像和生物标志物研究所（AIBL）数据集进行了一种新的出于培训目的，正在使用患者的横截面基线数据。本文的结构如下：第1节为背景，第2节为材料，第3节为方法，第4节为实验结果和讨论，第5节为局限性和未来工作，第6节为结论。2. 相关作品本节包含有关AD患者分类的MRI、PET图像特征和支持向量机（SVM）用于MCI和AD患者的分类（Hao等人， 2020年）。此外，MRI和PET还与随机森林（RF）特征选择算法和高斯分类器相结合，据报道在分类MCI和NC患者时具有78%的准确度（Forouzannezhad等人，2020年）。研究人员还对多模态数据进行了研究，包括MRI、认知测试、用于预测痴呆患者的开放获取序列成像研究（OASIS）的人口统计学（Khan和Zubair，2020; Battineni等人，2019年）。RF分类器与基于相关性的特征选择方法的融合用于对痴呆、非痴呆和非痴呆到痴呆转换器进行分类（Khan和Zubair，2020）。SVM分类器用于利用多模态数据对痴呆、非痴呆和非痴呆到痴呆的转换器进行分类（Battineni等人，2019年）。基于迁移学习的深度学习模型用于使用MRI数据对AD、MCI和健康患者进行分类（Farooq等人，2017年）。研究人员还提出了一种使用SVM的MRI变形量化模型，用于AD和MCI的分类（Long等人， 2017年）。此外，多-使用长短期记忆循环神经网络（LSTMRNN）的ADNI-TADPOLEMRI生物标记数据（Ghazi等人，2019年）。研究人员还再次提出了一种递归神经网络（RNN）前向填充算法，用于对来自ADNI-TADPOLE的多模态数据进行插补和训练（Nguyen等人， 2018年）。研究人员（Valenchon和Coates，2019）提出了一种基于多图的RNN和卷积神经网络（CNN）用于插补，并使用SVM分类器。研究人员还提出了使用认知、MRI、CSF特征的两阶段RF分类，其中缺失数据通过相应特征的平均值进行插补（Iddi等人，2019年）。此外，研究人员还提出了一种基于多图的方法，用于使用SVM分类器对ADNI-TADPOLE分类器数据进行缺失数据填补（Vivar等人，2019年）。总之，对各种类型的多模态特征进行了广泛的研究。但是，研究人员在寻找相关特征方面面临着一项具有挑战性的任务。因此，有效的特征选择算法在识别重要特征中是重要的。因此，我们提出的方法集中在特征选择算法，以克服这个问题。2.1. 特征选择技术：FS分析特征选择技术与预测模型的创建相关。研究人员使用许多特征排序方法和度量来选择相关特征（Molina等人，2002年）。在利用多模态数据进行阿尔茨海默病预测时，特征选择也是非常重要的。什么类型的特征的相关性或组合在区分AD与其他痴呆中是最重要的还没有被普遍化（Petersen等人， 1999年）。研究人员使用FS标准作为预测阿尔茨海默氏症的特征选择算法（ Beheshti 等人，2016; Zhou ， 2016; Song 等人， 2017 年）。Beheshti等人（2016）提出的特征选择算法使用FS和t检验得分找到最佳特征集。FS标准排序同样用于其他数据集的许多应用，如肝炎（Zhou，2016）、乳腺癌（Zhou，2016）、等生化性卒中（Zhou，2016）的检测。Zhou（2016）的研究人员使用遗传算法和FS的混合用于检测肝炎和乳腺癌。此外，在Zhou（2016）中，通过FS和互信息的混合来执行等化学中风检测。类似地，Fisher判别分析（FDA）和FS标准的混合被研究人员用于多类分类9 Song等人，2017年）。使用FS的特征选择算法的缺点如表1所示。然而，尽管如前所述的缺点，单独的FS是更好的特征排名方法。但是，使用FS找到最佳特征组合是特征选择中的一项具有挑战性的任务在本文中，我们提出了一种基于融合的算法表1相似FS算法的缺点。模态数据由MRI组成 PET和CSF用于使用SVM对MCI和非MCI进行分类（Zhang等人， 2011年）的报告。参考特征选择算法限制此外，ADNI-TADPOLE挑战数据集被研究人员广泛用于实验他们的方法（MarinescuBeheshti等人（2016年）混合（t检验和FS）寻找最优集基于排名例如，2018年）。从ADNI-TADPOLE挑战集的先前工作中观察到的数据清理方法主要有两种类型：1。通过替代值进行Zhou（2016）Hybrid（GeneticAlgorithm +FS）混合（FS +互信息）计算时间高计算时间高而不是缺失值，2.删除缺少值的样本-在ue研究人员通过对在不同时间点收集的纵向数据的缺失值进行数据填补来进行实验（Ghazi等人，2019; Nguyen等人，2018; Iddi等人，二〇一九年;Song等人（2017年）FDA + FS寻找最佳集合的阈值在阈值范围内查找最佳要素组合非常耗时Vivar等人，2019年）。研究人员进行了插补和训练Alummed Niyas K.P.和Thiyagarajan P.沙特国王大学学报4995Fig. 1. 所提出的特征选择算法的工作流程。其中使用FS和贪婪搜索来执行特征选择以克服挑战。最初，特征基于FS进行排名，然后以贪婪的方式基于其性能添加和消除特征在我们的方法中的贪婪搜索启发式找到一个更好的组合的功能，从而解决了FS在考虑功能组合的缺点基本思想是选择一个次优集合通过在FS的排名顺序中搜索每个特征仅一次来搜索特征。这种方法总是给出次优的最小特征集，因为贪婪算法从排名最高的FS特征开始搜索，然后基于其性能添加或删除特征。因此，我们的算法解决了FS的无能，同时通过更好的搜索启发式处理多个功能。此外，所提出的特征选择算法Alummed Niyas K.P.和Thiyagarajan P.沙特国王大学学报49961在不减少特征的情况下也实现了较低的时间复杂度。此外，该方法考虑了所有的特征，而不是将搜索限制在阈值内的一些特征3. 拟议方法所提出的算法的主要目标是：为了找到一个次优的最小特征组合，可以最大限度地提高性能的基于维的分类器，如SVM和KNN。● 设计一个时间效率高的特征选择算法方法说明如下：1. 选择特征。2. 数据的预处理3. 使用FS对特征进行排序。4. 提出了一种融合FS和贪婪搜索算法的次优最小特征子集选择算法5. 对所提出的特征选择算法返回的特征集进行了性能评价。留一交叉验证（LOOCV）和分层10倍交叉验证策略分别用于估计所得特征集的性能。使用BCA、精确度、灵敏度、特异度、F1评分等指标对二元分类进行评价。除了用于评估二元分类性能的所有指标外，多曲线下面积（MAUC）也用于三向分类（AD v/s MCI v/s NC）。图1包含所提出的特征选择算法的工作流程。3.1. 数据集本节描述了用于预测诊断的数据集和特征3.1.1. 数据集描述实验在ADNI-TADPOLE和AIBL数据集上进行。数据集的描述如下：阿德尼-塔波尔。ADNI-TADPOLE数据集由阿尔茨海默病神经成像倡议（ADNI）发布，作为阿尔茨海默病的竞争挑战数据集。这是研究人员免费获得的标准数据集之一（Marinescu et al.，2018年）。该数据集由在多个时间点收集的1737名患者的多模态数据组成。多模态数据包括MRI、PET、CSF和认知测试。ADNI-TADPOLE挑战数据集的主要目的是在早期阶段预测AD风险个体。该数据集是在ADNI项目（诸如ADNI、ADNI-1）期间在各个时期执行的个体的MRI、PET感兴趣区域（ROI）提取的特征、CSF、遗传和神经心理认知评估数据的集合（Marinescu等人， 2018年）。ADNI项目的参与者完全同意向公众分享他们的数据（Marinescu等人，2018年）。因此，我们选择了已经满足伦理关注的数据集进行研究。该数据集是来自各种模态的生物标志物的综合集合，这些生物标志物有希望区分AD与MCI和NC（McKhann等人， 2011年）的报告。AIBL。AIBL数据集于2016年11月14日发布，用于确定哪些生物标志物、认知特征、生活方式因素有助于从MCI患者中识别AD。与ADNI-TADPOLE类似，AIBL也是标准的免费数据集对于研究人员（Ellis等人， 2009年）。AIBL专业人员的参与者也完全同意向公众分享他们的数据（Ellis等人，2009年）。因此，我们选择了该数据集进行研究。该研究的队列来自澳大利亚。有超过1000名参与者的数据包括各种因素，如实验室数据，病史数据，生活方式数据，在不同的时间间隔收集认知数据。该数据集包括以6个月为间隔检查的4.5年纵向队列研究（Ellis et al.，2009年）。3.2. 特色描述特征的选择是在回顾了相关文献的基础上完成的。本研究考虑了两个数据集：ADNI-TADPOLE和AIBL以下特征选自ADNI-TADPOLE和AIBL数据集。3.2.1. ADNI-蝌蚪实验在ADNI-TADPOLE D1、D2合并文件数据集上进行。我们从这个数据集中选择了21个特征。从各种多模态中选择以下特征用于实验。表2包含有关功能及其说明的详细信息。MRI：海马、小脑、全脑、内嗅、梭状回、颞中回、颅内回，从Freesurfer软件获得。PET：氟代脱氧葡萄糖（FDG），通过PET图像采集技术捕获的AV-45 Florbetpir测量值。遗传因素：载脂蛋白E4（APOE4）是AD的遗传因素。认知测试：临床痴呆评定量表（CDRSB）、简易精神状态检查（MMSE）、Rey听觉语言学习测验（RAVLT）、阿尔茨海默病认知评定量表（ADAS）、功能活动问卷（FAQ）。● 教育：患者的教育水平。● 年龄：基线时患者的年龄（岁）。表2包含有关ADNI-TADPOLE功能及其说明的详细信息。3.2.2. AIBL从AIBL数据集中选取了18个多模态特征使用AIBL的实验选择了来自各种多模态的以下特征。认知测试：简易精神状态检查（MMSCORE）、临床痴呆评分总体（CDGLOBAL）、2回忆的故事单元总数-逻辑记忆立即回忆（LIMMTO-TAL）、回忆的故事单元总数-LM测试的部分评分实验室数据：促甲状腺激素、维生素12、红细胞计数、白细胞计数、血小板、血红蛋白、平均细胞血红蛋白、平均细胞血红蛋白浓缩物、尿素氮、血清葡萄糖、胆固醇和肌酐。表3包含有关AIBL的功能及其解释的详细信息。据观察，在两个数据集用于研究的特征中，只有两个共同特征，即CDRSB和MMSE。因此，通过合并两个数据集进行研究因此，实验是分开进行的-1同MMSE，ADNI-TADPOLE中的认知测试2与CDRSB相同，ADNI-TADPOLE中的认知测试●●●●●●●Alummed Niyas K.P.和Thiyagarajan P.沙特国王大学学报4997XX表2关于ADNI-TADPOLE中功能的说明，请参见https://github.com/ swhustla/pycon 2017-alzheimers-hack/blob/master/docs/tadpole_data_dictionary.csvAC-前扣带回，PC-顶叶皮质。做出他们的预测。因此，医生可以在短时间内用较少的数据预测AD。从研究中排除从AD恢复为MCI和从MCI恢复为NC的患者。此外，本发明还考虑MCI转为AD、NC转为MCI的患者特征描述电子邮件 *海马海马体积全脑全脑体积内嗅容积梭形卷MidTemp中温体积ICV颅内体积临床痴呆评定量表简易智能状态检查量表RAVLT_learning雷伊听觉言语学习测验RAVLT_立即雷伊听觉言语学习测试（5总和）RAVLT_遗忘雷伊听觉言语学习测试遗忘RAVLT_Perc_Forgetting_bl Rey听觉言语学习测试百分位数忘ADAS 11阿尔茨海默11ADAS 13阿尔茨海默13常见问题功能活动问卷FDG平均FDG-PET的角度，时间，后扣带回相对于小脑，额叶、AC、楔前叶和顶叶皮质的平均AV45 SUVR载脂蛋白E4年龄基线PTEDUCAT教育DX诊断状态表3有关AIBL中功能的描述，请参见http://adni.loni.usc.edu/data-dictionary-search/。特征描述AXT 117促甲状腺激素BAT 126维生素12HMT3红细胞计数HMT7白细胞计数HMT13血小板计数HMT40血红蛋白HMT 100平均细胞血红蛋白HMT 102平均细胞血红蛋白浓缩物RCT 6尿素氮RCT 11血糖RCT 20胆固醇RCT 392肌酐MMSCORE简易精神状态检查评分LIMMTOTAL回忆的故事单元总数-逻辑记忆立即召回LDELTOTAL召回的故事单元总数-逻辑部分得分记忆测试CDGLOBAL临床痴呆评定Global DXCURREN诊断状态在两个数据集上。通过这样做，主要目标是发现：在执行所提出的特征选择算法后，在所得到的最小特征集中是否有任何共同的区别特征？3.3. 预处理在这两个数据集中，仅考虑基线阶段患者的横断面数据用于实验。执行此步骤以找出使用基线训练数据在基线阶段本身预测AD的有效性。就医生而言，仅使用基线数据的预测在许多方面都有帮助。医生不需要等待进一步的随访数据，AD和MCI。在最后一步中，从研究中排除任何所选特征数据缺失的患者。未对缺失数据进行数据插补。经过上述预处理步骤，在ADNI-TADPOLE上获得的CN、MCI和AD患者的数量分别为231、358和94。AIBL上CN、MCI和AD的数量分别为609、143和105。ADNI-TADPOLE数据的人口统计学描述见表4。AIBL数据的人口统计学描述见表5。3.3.1. 提出了融合FS和贪婪搜索的特征选择算法该算法首先基于FS对特征进行排序，然后基于它们的性能逐个迭代地添加排序的特征。算法的详细说明如下：FS.最初，模型基于FS标准对特征进行排名。FS准则期望找出最大化类间距离（BCD）和最小化类内距离（WCD）的特征。具有高FS的那些特征可以提高分类器如SVM和KNN的性能（Song等人， 2017年）。特征的FS基于类距离与类内样本距离之间的散射比（Gu等人，2012年）。特征“i”的BCD和WCD由等式给出。（1）和（2）分别。总的FS由等式（1）计算。（三）、LBCD i¼Overallmean-平均值标签i1/1LWCD i¼variancelvel i2002年1/1表4ADNI-TADPOLE数据集的人口统计学总结，包括平均值、最小值、最大值和标准差。统计NCMCIAD年龄（岁）是说72.7871.0873.19最大89.090.388.0最小59.055.655.0标准偏差5.8078.2307.239MMSE是说29.0428.1123.06最大30.026.030.0最小24.019.023.0标准偏差1.26422.0411.67表5AIBL数据集的人口统计学总结，包括平均值、最小值、最大值和标准差。NR-未报告。统计NC MCI AD年龄（岁）平均值最大值最小值标准偏差NRNRNRNRNRNRNRNRNRMMSE是说28.7026.94420.28最大30.026.030.0最小24.019.023.0标准偏差1.26422.0411.67Alummed Niyas K.P.和Thiyagarajan P.沙特国王大学学报4998XXXXFSi¼BCDi=WCDi3其中Overallmean是特征的overallmean， meanlabel是对应于各个标签的特征的平均值，vari-ancelel是对应于各个标签的特征的方差，L是类的数量。简而言之，FS度量取决于对应于标签的特征的均值和方差这就是为什么我们提出的包含FS的算法在算法1中提到的所提出的模型在FS排名特征上实现特征按FS的递增顺序排列（最高FS特征为rank1，第二高FS分数特征为rank2，依此类推）。融合FS和贪婪搜索的特征选择算法在按每个特征的秩序遍历一次后选择一个次优的最小特征集。最初，仅将排名最高的特征添加到所需的最小特征子集（当前特征集），并且还评估性能。然后，将下一个排名的特征添加到当前特征集中，并对新的特征集进行性能评估。如果分类器的性能提高，则新添加的特征保留在当前特征集中。否则，它将被丢弃。使用LOOCV对所选群组的数据评估分类器的性能。BCA是用于评估分类器性能的度量。同样，每个特征的性能由算法评估。基于其性能保留或丢弃特征。因此，建议的融合特征选择算法找到一个次优的最小特征集遍历每个功能只有一次。所提出的算法的伪代码在算法1中给出算法1.融合FS和贪婪搜索的特征选择算法。输入：所有多模态特征的集合输出：用于分类AD的最小特征集方法：查找所有功能按FS的降序对特征进行排序（将最顶部的FS特征列为1，依此类推）。初始化等级=基于等级排列的要素初始化BCA = 0.0Initial []对于i = ranks[1] to ranks[last]，执行addresseset.append（ranks[i]）即，将特性添加到特性集使用featureset对数据集执行LOOCV并评估BCA如果（BCA未增加），则执行item_remove.remove（ranks[i]），即从集合中删除该功能返回生成的要素集分类器。实验进行了两个分类器，即SVM和KNN的研究。 SVM和KNN都是医学领域中使用的最流行的监督ML算法之一（Kaucha等人，2017; Verma等人，2017; Xing和Bei，2019）。此外，实验也不是在大的特征集上进行的。因此，选择支持向量机和KNN是适合我们的分类研究.如果存在大的特征集并且需要训练计算上昂贵的大数据，则需要涉及神经网络的分类器因此，涉及神经网络的分类器不被考虑用于我们的研究。由于所提出的特征选择算法找到了最小特征子集，因此需要典型的ML分类器，如SVM和KNN。此外，它们在计算上也是使用Python中包含SVM和KNN的Sci-kit学习包的内置函数进行分类。我们的研究使用SVM的径向基函数（RBF）核函数和Sci-kit学习包的1-Nearest Neighbor。选择正则化参数c = 10和gamma = 0.02作为SVM中RBF核的参数。然后对RBF神经网络的正则化参数和Gamma值进行了选择，一网格搜索为各种组合c = 10，20，30，40，50和γ = 0.01，0.02，0.03，0.04，0.05，0.06，0.07,0.08,0.09,0.10.以下指标用于评估算法的性能：BCA：BCA是一种用于测量不平衡数据集准确性的度量标准整个系统的BCA是各个类的精度之和。类“i”的BCA在等式中给出。（4）和整体BCA在等式中给出。（五）：BCAi¼1= 2ω½TP=TPFNTN=TNFP]4然后，所有类别的整体BCA是每个类别的个体BCA的平均值，如等式中所给出（四）：LBCA1/4=LωBCA1/ 51/1精密度：类“i”的精度（六）：精密度i¼TP= ΔTPΔFPΔ6Δ其中TP是真阳性，FP是假阳性。的EQ。（6）通过找到在该类的混淆矩阵中真阳性与真阳性和假阳性之和之间的比率来计算单个类的精度。总体精密度是每个类别的单个精密度的平均值，如等式中所示。（七）：L精密度1/4=Lω精密度1/41/1灵敏度或真阳性率：类“i”的灵敏度（八）：Sensitivityi¼TP= ΔTPΔFNΔ8Ω其中TP是真阳性，FN是假阴性。的EQ。（8）通过找到在该类别的混淆矩阵中真阳性与真阳性和假阴性之和之间的比率来计算单个类别的敏感度。总体灵敏度是每个类别的个体灵敏度的平均值，如等式中所示。（9）：L灵敏度1/4=Lω灵敏度1/41/1特异性或真阴性率：类“i”的特异性在等式中给出。（十）：专属性i<$TN=100TN100FP其中TN是真阴性，FP是假阳性。的EQ。（10）通过找到在该类别的混淆矩阵中真阴性与真阴性和假阳性之和之间的比率来计算单个类别的特异性。总体特异性是每个类别的个体特异性的平均值，如等式中所示。（十一）：L特异性1/4=Lω特异性1/41/1●●●●●●Alummed Niyas K.P.和Thiyagarajan P.沙特国王大学学报4999XXMAUC：整体MAUC在等式中给出。（十二）、排名功能（认知测试）可以提高性能（见表7）。对于683名患者的所选队列，如L-1LMAUC¼1=LL- 1ω1=niωnkωSRi-niωni1= 2]i<$1j<$ i<$1½SRk-nkωnk1=2]12其中L是不同类的数量，ni是类“i”中可用点的数量，n k是类“k”中可用点的数量4. 实验结果和讨论实验在Intel Core i5处理器CPU@2.40 GHz Lenovo机器上进行。所提出的FS和贪婪搜索（参见算法1）特征选择算法的融合返回具有高重要性的次优最小特征下一步是评估结果特征集的性能因此，使用LOOCV和分层10倍交叉验证策略（单独）对选定队列的数据进行次优特征的性能评估由于两个数据集的次优最小特征集和所选队列数据较小（n 1000），因此使用LOOCV进行评价<此外，计算成本较低的分类器，如支持向量机和 KNN 在研究中使用。因此，LOOCV策略用于利用所有选定队列的数据进行训练和测试。然而，LOOCV策略是在我们研究的不平衡数据集上执行的。因此，分层K折交叉验证也被用于获得更多关于次优最小特征集的性能的见解由于分层K折叠交叉验证评估可以在每个折叠期间保持相等比例的标签表示，这是克服在不平衡数据集的训练中出现的缺点的良好策略（Pedregosa等人， 2011年）的报告。10倍分层交叉验证在整个实验中的文件。据观察，最近的文献，特别是在医学领域，使用分层的10倍交叉验证具有良好的性能（Zhang等人，2017; Marques等人，2020; Sarawgi等人，2020; Khagi等人，2019年）。每10倍测量一次性能指标，如BCA、灵敏度、特异性、F1评分计算每个折叠中的性能指标的平均值，以给出最终性能测量。分别使用LOOCV和分层10倍交叉验证，同时使用三向和二进制分类的次优最小特征集评估性能。所提出的特征选择方法的性能是在ADNI-TADPOLE和AIBL数据集上进行评价。本节解释了ADNI-TADPOLE和AIBL报告的实验结果以及讨论。4.1. 关于ADNI-TADPOLEADNI-TADPOLE数据集上特征的FS排序按降序如下：CDRSB、MMSE、ADAS-13、ADAS-11、FAQ、RAVLT_Immediate、FDG、RAVLT_perc_forgetting 、 RAVLT_learning 、 Hippocampus 、 AV45、Entorhinal、MidTemp、Fusi- form、APOE 4、脑内、全脑、AGE、RAVLT_forgetting、PTE- DUCAT、ICV（见表6）。据观察，所有排名靠前的特征都没有最大化SVM和KNN的性能。然而，低等级特征如AV45或FDG与高等级特征的组合，ADNI-TADPOLE数据集上的FS和贪婪搜索特征选择算法（NC v/sMCI v/ s AD）是：CDRSB、MMSE、ADAS-13和AV 45。表7中显示了使用具有LOOCV策略的SVM和KNN分类器的拟议特征在ADNI-TADPOLE上评估的性能指标。使用CDRSB、ADAS-13、MMSE和AV 45对NC、MCI和AD进行分类，使用LOOCV的SVM和KNN实现了此外，所提出的方法已经报告了使用LOOCV的SVM和KNN的MAUC分别为0.97和0.98（参见表7）。当使用SVM和KNN以及LOOCV将NC预测为MCI时，错误分类相对较高（见表9和10）。表9和表10中给出了使用LOOCV的ADNI-TADPOLE上的SVM、KNN的混淆矩阵。表8包含使用CDRSB、ADAS-13、MMSE和AV 45进行分层10倍交叉验证的性能结果。KNN使用分层10倍交叉验证分别实现了90%和0.96的最高BCA和MAUC。表11和12分别包含了使用LOOCV和分层10倍交叉验证的ADNI-TADPOLE二进制分类的对于使用SVM的二元分类，使用认知测试（如MMSE和CDRSB）对ADNI-TADPOLE进行的NC v/s AD的BCA为98%，使用MMSE、CDRSB、FDG和AV45进行的MCI v/s AD和MCI v/s NC分类的BCA为100%。然而，KNN报告了所有二进制分类的巨大性能准确性。值得注意的是，在使用KNN，MMSE，CDRSB、FDG、AV 45报告BCA为100%（见表11和12）。4.2. 关于AIBLAIBL数据集上特征的FS排序（降序排列）如下：LDELTOTAL、CDGLOBAL、LIMMTOTAL、MMSCORE、HMT 100、RCT 6、HMT 102、HMT 40、HMT 3、RCT 20、RCT 392、AXT 117、RCT11、HMT 13、HMT 7、BAT 126（见表13）。然而，在这方面，类似于ADNI-TADPOLE，所有排名靠前的特征都没有最大化SVM和KNN的性能。低等级特征与高等级特征的组合可以提高SVM的性能，这也是ADNI-TADPOLE中的一种模式表6ADNI-TADPOLE数据集上特征的FS排名。秩数特征FS值1CDRSB3.264562MMSE2.8252673ADAS-132.35097014ADAS-111.8761375FAQ1.60595826RAVLT_立即1.1041497FDG0.901568RAVLT_Perc_遗忘0.6985529RAVLT学习0.59917710海马0.5064711AV450.43227812内嗅0.41053013中温0.27711114梭形0.19405915APOE40.16538416心室0.11992317全脑0.0485718年龄0.019719RAVLT_遗忘0.013436620PTEDUCAT0.011632221ICV0.00840●Alummed Niyas K.P.和Thiyagarajan P.沙特国王大学学报表75000使用SVM和KNN对ADNI-TADPOLE（3向分类）和LOOCV的性能指标总结。分类器总特征选择的功能特征BCA精度灵敏度特异性MAUCSVM214CDRSBADAS-13MMSEAV4590.10%93.63%90.40%百分之九十五0.97KNN214CDRSBADAS-13百分之九十一百分之九十点六一90.66%94.66%0.98MMSEAV45表8使用SVM和KNN对ADNI-TADPOLE（3向分类）进行分层10重交叉验证的性能指标总结分类器特征总长度建议特征长度特征BCA精度灵敏度特异性MAUCSVM214CDRSBADAS-13MMSEAV45百分之八十八百分之八十九百分之八十八百分之九十一0.95KNN214CDRSBADAS-13MMSE百分之九十百分之九十百分之九十百分之九十0.96AV45表9ADNI-TADPOLE上SVM的混淆矩阵，使用LOOCV（3路分类）。NCADMCINC209022AD07816MCI08350表10使用LOOCV（3向分类）在ADNI-TADPOLE上的KNN混淆矩阵NCADMCINC214017AD08311MCI1413331(see表14）。对于所选的患者队列，如通过所提出的FS和贪婪搜索特征选择算法（NC v/s MCI v/s AD）在AIBL数据集上的融合所发现的高度重要的特征是：LDELTOTAL、CDGLOBAL和MMSCORE。表14显示了使用SVM和KNN以及LOOCV在AIBL数据集上评价的性能指标。所提出的特征选择算法已经报告了77%的BCA与SVM，76%的 KNN 分别使用 LDELTOTAL ， MMSCORE ，和 CDGLOBAL 与LOOCV。表15包含了使用SVM和KNN对AIBL数据集进行分层10倍交叉验证的性能。值得一提的是，SVM的BCA、精确度、灵敏度和特异度分别达到了92.5%、87%、92%和92%，使用分层10倍交叉验证（见表15）。当使用SVM将AD预测为MCI（参见表16）和使用具有LOOCV的KNN将 MCI预测为AD（参见表17）时，AIBL中的错误分类率相对较高。表16中给出了使用LOOCV的AIBL上SVM的混淆矩阵。表17中给出了使用LOOCV的AIBL上KNN的混淆矩阵。表18和19包含了使用LOOCV和分层10倍交叉验证的二进制分类的AIBL上的拟议特征（由拟议特征选择算法返回）的性能。使用SVM和KNN对AIBL进行的二进制分类报告了MCI v/s相对较低的结果使用CDGLOBAL和MMSCORE和LOOCV进行AD分类，BCA分别为84%和82%。然而，我们提出的方法已经报告了更好的敏感性84%的SVM和特异性82.5%的KNN在分类MCI和AD也突出了使用LOOCV的特征选择算法的重要性。认知测试如 CDGLOBAL 、 LIMMTOTAL 、LDELTOTAL和MMSCORE是分类MCI v/s AD的有前景的特征（见表18和19）（见表20）。4.3. 缺失数据处理应注意，与其他比较研究不同（Nguyenet al.，2018; Iddi等人，2019），我们方法的缺失数据处理涉及删除所有特征数据缺失的患者。然而，研究（Ghazi等人，2019; Iddi等人，2019）使用RNN和R工具Nguyen等人进行数据插补，2018年的BCA、MAUC低于我们在ADNI-TADPOLE数据集上的方法（见表21）。进行的研究表11在ADNI-TADPOLE上使用SVM和KNN进行LOOCV二进制分类的性能指标总结分类器分类类型建议的功能BCA精度灵敏度特异性SVMNC v/s ADMMSE、CDRSB百分之九十八百分之九十六百分之九十九百分之九十八MCI v/s ADMMSE、CDRSB100%的100%的100%的100%的MCI vs/s NCMMSE、CDRSB、FDG、AV45100%的100%的100%的100%的KNNNC v/s ADMMSE、CDRSB100%的100%的100%的100%的MCI v/s ADADAS 11，全脑100%的100%的100%的100%的Alummed Niyas K.P.和Thiyagarajan P.沙特国王大学学报表75001MCI vs/s NCMMSE、CDRSB100%的100%的100%的100%的Alummed Niyas K.P.

下载后可阅读完整内容，剩余1页未读，立即下载