没有合适的资源?快使用搜索试试~ 我知道了~
医学信息学解锁26(2021)100766使用一组局部脑体积辅助诊断多发性硬化症:患者和健康对照的分类模型Sorama Aokia,*,Juichi Fujimorib,Ryoko Mikami a,Kenji Hoshi a,Junko Kawakami a,佐藤健一a、中岛一郎 ba东北医科药科大学医药信息科学部,仙台市青叶区小松岛4-4-1, 981-8558,日本b日本仙台市宫城区室1-15-1东北医科大学神经内科,邮编:983-8536A R T I C L EI N FO保留字:多发性硬化标准化脑容量分类贝叶斯正则化神经网络支持向量机自组织映射1..A B S T R A CT多发性硬化(MS)是一种病因不明的中枢神经系统炎症性疾病,以时间和空间上的播散为特征。由于没有疾病特异性症状或诊断标志物,因此难以早期明确诊断MS;因此,根据反复复发和缓解的临床特征和特征性磁共振成像(MRI)结果进行综合判断,以区分MS与其他疾病在这项研究中,我们试图使用机器学习方法构建一个预测分类模型,该模型基于对MS引起的脑萎缩特征的定量评估,准确区分健康对照(HC)和MS患者。我们使用了从72名MS患者和21名HC的MRI图像计算的每个脑区的55个片段的脑体积。将这些数据输入到监督学习方法(贝叶斯正则化神经网络(BRNN)和支持向量机(SVM))中,用于训练脑萎缩的波动模式。该模型的准确性为77.8%的敏感性和95.2%的特异性交叉验证。MS预测率与E×扩展残疾状态量表(EDSS)评分相关(r=0.413,p 0.0001),表明MS导致的身体残疾的严重程度<我们还建立了一个模型使用自组织映射(SOM),以确认在15个部分的大脑区域的波动,贡献最大的分类的基础上的自动相关性确定(ARD)功能的BRNN。确认波动可能是MS脑萎缩的特征,与以前的研究结果一致基于本文获得的结果,我们得出结论,健康和MS可能适当地反映了MS患者脑萎缩的复杂数据结构。此外,该模型的MS预测率具有作为MS医疗护理中的可量化伪标记的潜力。虽然目前的模型有一些局限性,如年龄变化的程度,这种方法的优点是不包括主观评价取决于个别医生的经验。 因此,它可以提供有助于MS诊断的客观指标,MS现在主要由一个定性方法。2. 介绍多发性硬化(MS)是中枢神经系统(CNS)的慢性疾病,其病理特征在于炎症、脱髓鞘、神经胶质增生(瘢痕形成)和神经元损失。MS是最常见的慢性炎性脱髓鞘疾病,是仅次于头部创伤的第二大神经功能障碍原因,始于成年早期至中期[1]。尽管许多研究表明MS的环境(EB病毒感染、吸烟和维生素D缺乏)和遗传(疾病易感基因、家族史和白人优势)风险因素,由于MS的复杂性和异质性,潜在的发病机制仍然未知[2]。因此,没有外部验证的血液免疫标志物具有诊断MS的足够灵敏度和特异性[3]。由于MS病变通常发生在不同的时间和不同的CNS位置(即,在时间和空间上传播),其症状各不相同* 通讯作者。电子邮件地址:s-aoki@tohoku-mpu.ac.jp(新加坡)Aoki)。https://doi.org/10.1016/j.imu.2021.100766接收日期:2021年7月11日;接收日期:2021年10月13日;接受日期:2021年10月16日2021年10月20日网上发售2352-9148/© 2021作者。出版社:Elsevier Ltd这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。可在ScienceDirect上获得目录列表医学信息学期刊主页:www.elsevier.com/locate/imuS. Aoki等医学信息学解锁26(2021)1007662××取决于受影响的位置。典型的表型包括但不限于导致视觉活动减弱的视神经炎、导致肢体无力和感觉障碍的急性肌无力以及导致复视或共济失调的脑干病变。因此,在MS的早期阶段做出明确的诊断是困难的,并且因此,强烈期望特异性疾病标志物。为了满足这些要求,我们试图构建一个模型,区分患者与健康对照组(HC)使用一组脑容量,反映MS病变的影响。该模型的输出,i。例如,MS预测率将提供与MS相关的神经变性的定量和横截面信息。因此,该MS预测率可以为MS的诊断提供有用的客观信息,这通常需要专业知识,并且有可能开发MS的可定量伪生物标志物。尽管之前尝试分析MS数据,但获得迄今为止,由于MS患者之间的显著差异,例如MS病变的位置及其病程,因此这种方法是有限的。MS的病程通常始于神经功能障碍的反复复发 通常持续 一个月 的 前期此后,大约一半的患者通常在10-20年后发展为“进行性“临床过程,其最终表现为活动性和认知受损;约15%的患者具有从疾病发作开始MS影响全世界超过200万人,并且目前是不可治愈的;因此,治疗计划包括两类:使用类固醇治疗急性发作,和(2)用降低MS的生物活性并防止复发的疾病修饰剂治疗。由于目前没有明确的诊断测试MS,其诊断需要仔细的鉴别诊断。由于病变发生在CNS中,因此难以进行活检;然而,磁共振成像(MRI)彻底改变了MS的诊断,2001年提倡使用MRI的McDonald诊断标准[4]。然而,这些标准的一致性应用对于非成像专家来说具有挑战性[5,6],因此,正在进行修订[7,8]。MRI的进展还显示,MS中的神经变性导致脑体积比HC中更快地减小[9,10]。基于MRI的研究报告MS期间的体积变化与身体残疾和认知障碍的严重程度相关[11,12]。最近进行的脑体积变化的统计分析表明,MS的神经变性不是随机发生在CNS,而横断面和纵向研究的结果表明,具体模式[12这些信息是通过自动-自2010年以来,用于MRI的matic脑结构分割软件[15,16]。尽管有这些神经退行性发现,但仍然没有可量化的标记物来通过MRI识别MS。其中一个原因是脑容量的个体差异是非线性的;因此,很难通过经典的统计方法获得有用的临床应用结果[17]。最近,已经进行了许多尝试,使用机器学习方法基于MRI图像对MS进行分类。据报道,使用T1加权MRI对MS患者和健康对照进行基于卷积神经网络(CNN)的分类的准确率超过98%[18,19]。虽然这些报告的准确性很高,但它们并不包括对哪些大脑区域有助于分类的医学分析,而只是CNN本身的结构及其准确性的提高。然而,在专注于这些医疗方面的同时,也正在采取方法来执行机器学习。一些建议使用SVM [20]和基于图形的CNN [21]对MS的四种疾病类型进行分类,然后将MRI结果呈现为考虑大脑结构连接性的图形。此外,Francesco et al.提出了基于逻辑的框架,结合答案集程序每个区域的脑体积,结果的解释可以比上述通过图像识别和绘图的研究更简单和具体地与脑功能相关联。然而,如前所述,由于多变量和个体差异,数据的笨拙是有问题的。我们以前建造和报告了预测甲状腺功能障碍和库欣机器学习方法使用一组常规实验室测试值,这些值也是多变量和高度个性化的[23此外,在日本医院,这些用于在专门测试(如激素测量)的前期进行筛查的模型已成功应用并检测出误诊患者[27,28]。高度在这些研究中获得了准确的发现,因为机器学习方法比经典的统计方法对高度非线性的医学数据更敏感。因此,我们通过结合监督、非监督学习方法和临床表现的解释,继续构建MS预测模型和基于这些条件的准确性评估。3. 方法3.1. 患者2017年6月至2018年6月期间,在日本仙台东北医科大学附属医院神经内科横断面招募了72例MS患者和21例HC。 根据2017年McDonald标准诊断MS [8]。入选标准如下:(1)当前年龄在20 - 70岁之间,(2)至少3个月内无MS复发史。排除标准如下:(1)患有视神经肌萎缩症谱系障碍或髓鞘少突胶质细胞糖蛋白抗体相关疾病;(2)有除稳定抑郁症状外的精神病史。此外,有2例首次临床发作潜在MS(临床孤立综合征)的患者被排除在本分析之外。我们使用扩展残疾状态量表(EDSS)[29]评估患者身体残疾的严重程度。在数据收集时的72例MS患者中,59例复发缓解型MS(RRMS),12例继发性进展型MS(SPMS)和1例原发性进展型MS(PPMS);在本研究中,我们将SPMS和PPMS患者一起处理为进展型MS(PMS),因为只有1例PPMS,脑容量值的趋势与其他SPMS患者没有差异。数据集的描述见表1。机构伦理委员会批准了研究方案,所有患者都提供了参与的书面知情同意书。3.2. MRI获取所有研究受试者均在单个全身1.5 T MRI系统(Siemens,Germany,Aektom Aera)上进行扫描。标准化方案包括高分辨率矢状面3维(3D)T1加权磁化准备的快速梯度回波(MPWE)序列(重复时间(TR)2730 ms,回波时间(TE)3.3 ms,反转时间(TI)1000 ms,176个切片,视野(FoV)256 mm,以及测量的各向同性体积大小111 mm)和矢状面3D流体衰减反转恢复(FLAIR)序列(TR 5000 ms,TE 335ms,TI 1000 ms)。1800 ms,176个切片,FoV 256 mm,测量的各向同性体积尺寸1×表1患者(RRMS、PMS)和健康对照的数据集信息和机器学习方法。 他们把图表应用在分类上-RRMS PMS HC确定了MS的阳离子,并确定了决定疾病演变的最相关的脑区域[22]。在本研究中,我们使用机器学习(人工智能)方法定量检查MS中的脑体积变化,以建立MS的预测模型。n 59 13 21性别(男/女)12/47 6/7 10/11扫描时的年龄(岁,平均值(SD))38.86(9.69)47.54(8.41)36.24(13.6)病程(年,平均值(SD))8.79(6.65)15.12(8.04)EDSS(中位数(范围))1.5(0.0-4.5)6.0(3.5-8.0)-S. Aoki等医学信息学解锁26(2021)1007663×11mm)。3D-MPG图像用作后处理流水线中的输入图像,并且使用自动FreeSurfer流(版本5.3.0,https://surfer.nmr.harvard. edu)[30-35 ]。3.3. 机器学习方法分析我们使用FreeSurfer的自动分割结果(表2)直接从每例患者的55个节段中提取脑体积我们同时确认每个脑体积值分布并进行对数转换对于对数正态分布的项目。在完成这些预处理步骤后,我们使用两种类型的监督学习方法构建了三类(HC,RRMS患者和进行性MS患者)分类模型。监督学习的崩溃表2本研究中使用的每个脑区的55个片段的列表方法:贝叶斯正则化神经网络(BRNN)和支持向量机(SVM)。采用两种监督学习方法的原因是为了验证通过使用两种不同算法的方法执行相同计算并确认哪种方法更准确而获得的结果的稳定性和有效性。在训练和构建模型时,通过留一法交叉验证和绘制ROC曲线来验证模型的准确性。由于本研究的目的是对HC和MS组进行分类,因此在准确性评价中将RRMS和进行性MS类别的预测结果一起处理。通过同时确认计算的MS预测率和EDSS评分之间的相关性,我们还研究了发展的身体残疾的严重程度和MS预测率的强度之间是否存在关系。为了确认在计算中使用的大脑区域体积对于模型构建是必不可少的,我们随后检查了在BRNN的学习过程中计算的自动相关性确定(ARD)的参数以及模型构建。然后,我们进行了无监督学习,以澄清HC和MS患者中假定的基本脑区体积是如何分布和波动的自组织局部脑体积的变量名称描述自组织映射神经网络(SOM)是目前用于无监督学习的一种神经网络study. 在这项研究中的流动的图示表示脑干脑干体积BrainSegVolNotVent无脑分割体积在图1中。使用IBM SPSS Statistics Version 24软件进行统计学分析,用于BOX图、ROC和计算PearsonBrainSegVolNotVentSurf心室脑分割体积,不含来自表面的MS预测率与EDSS之间的相关系数。p值小于0.05被认为是显著的。CC_胼胝体体积的前前区CC_中央胼胝体中央区域3.4. BRNNCC_中_前体积胼胝体体积BRNN是一个多层神经网络,它被扩展为包括贝叶斯概率框架,用于处理模型参数,CC_Mid_Posterior胼胝体体积CC_胼胝体后后区避免Mackey和Neal在传统的最大似然方法中遇到的缺陷,例如过拟合[36]。 类似于其他反向传播网络,BRNN训练程序调整,皮质皮质白色物质体积皮质灰质体积皮质白质体积网络的权重和偏置,以最小化训练案例中的误差测量。BRNN将贝叶斯框架引入到这种训练中CSF脑脊液容量第五脑室容积第四脑室容积左(右)_伏核_面积左(或右)伏核面积容积左(右)_杏仁核左(或右)杏仁核容积左(右)_尾状核左(或右)尾状核体积左(右)_小脑_皮质左(或右)小脑皮质体积左(右)_小脑_白质_左(或右)小脑白质过程,通过给出超参数(即,权重和偏差)高斯先验分布,并通过实施马尔可夫链蒙特卡罗(MCMC)方法计算后验分布[37]。BRNN包括称为ARD的重要特征,其自动确定未知相关性的输入值实际上与分类相关ARD是通过使每个输入单元的连接上的权重左(右)_脉络丛左(右)_海马体积左(或右)脉络丛体积左(或右)海马体积由与该输入相关联的超参数控制,从而允许每个输入的相关性被自动评估为左(右)_Inf_Lat_Vent左(或右)下侧脑室这些超参数的值适应数据。虽然对左(右)_外侧_左髁(右)_苍白球左(右)_壳门体积左(或右)侧脑室容积左(或右)苍白球容积左(或右)壳核体积输入的相关性在实际建模问题中很重要,ARD被认为是选择模型输入和分析最终模型的实用函数,并具有许多应用[38,39]。左(右)_丘脑_左(或右)丘脑体积左(右)_丘脑DC左(或右)腹侧间脑由于在实验中使用了由55个项目组成的许多脑区域体积如上所述,我们利用ARD参数,左(右)_血管lh(rh)皮质醇体积左(或右)血管容积左(或右)半球皮质灰质体积确认哪个区域卷有助于分类。我们使用Neal的lh(rh)皮质白物质左(或右)半球皮质白关于中间层和中间层中的神经元数量non_WM_hypointensitiesOptic_ChiasmSubCortGrayplasm大脑灰质视交叉体积皮质下灰质体积为了确定需要设置为计算参数的MCMC采样迭代次数,我们搜索了使训练集的LOO计算的计算精度稳定的参数,逐渐增加幕上容积幕上容积无脑室两个价值观。 因此,我们采用了神经元的数量-中间层为18和1200 MCMC采样迭代。幕上VolNotVentVoX表面孔幕上容积容积Xel计数(不包括脑室)表面缺陷孔总数安装前3.5. SVM第三脑室容积总灰质体积WM_hypointensities白质低信号体积Vapnik及其同事开发的SVM是一个学习系统,高维特征空间中的线性函数的假设空间,用来自优化理论的学习算法训练S. Aoki等医学信息学解锁26(2021)1007664图1.一、本研究流程的图示。这是一种令人信服的方法。它处理核函数,它定义了线性学习机运行的隐式特征空间。核函数的使用是有效利用高维特征空间的关键,并且决策边界被选择为边缘最大化的边界。支持向量机在高维空间中找到一个具有最大间隔的线性分离超平面。该边界的位置由数据点的子集标识这就是所谓的支持向量[41由于这些特点,SVM是在许多领域中常用作分类器。例如,2019年,在涉及急诊医学临床决策支持系统的所有研究中,约有10%使用了SVM [44]。另一方面,原则上,SVM仅通过分离超平面绘制两个组之间的边界;因此,不可能确认哪个项目有助于分类。所构造的模型的输出结果也不能以基于后验概率的类别预测率的形式获得。因此,在本研究中,我们使用了Chang等人开发的LIBSVM包[45],该包支持多类分类并以概率输出预测结果[46],从而允许将获得的结果与BRNN进行比较。 在本研究中,我们选择了径向基函数(RBF)核的支持向量机,进行了网格搜索的参数C和g的RBF使用LOO,并采用g为1和C为1024。3.6. SOMSOM部分由视网膜-皮层映射激发,是一种无监督的竞争学习人工神经网络,由Kohonen设计的二维规则节点网格组成[47]。 SOM上的每个节点由一个n维原型向量表示,其中n是输入数据的维数,并随机初始化。在训练步骤中,输入的训练样本被顺序地选择并搜索最近的节点(也称为“最近节点”)。最佳匹配单元; BMU)到每个输入样本的向量。BMU及其邻居节点的原型向量根据学习速率向样本向量移动。通过迭代此训练过程,同时逐渐减小邻域半径和学习速率,相似数据样本的BMU在地图网格上彼此接近,并在SOM上显示为相似数据样本的空间聚类。因此,通过根据数据结构形成这些聚类,可以在二维地图上可视化高维数据。此外,在SOM的训练完成之后,每个地图节点中的单个矢量分量的值也可以被可视化为分量平面。 虽然使用分量平面有几个优点,但三个主要优点如下:该分量的值的分布,聚类属性(即,是什么使它成为一个集群),以及揭示相似模式的组件对之间的相关性,S. Aoki等医学信息学解锁26(2021)1007665×==各部件平面的相同位置[48]。这些特征允许检查训练结果;例如,如果特定数据样本偏离假设的聚类,则它们偏离的原因可能是单独检查。由于这些优点,SOM在医学和生物学领域的应用正在扩大[49另一方面,SOM的简单算法增加了与识别噪声高维数据的聚类相关的困难,例如微阵列数据集的分析[52]。在本研究中,我们通过比较两个SOM来确认聚类; SOM是用所有55个脑体积段训练的,而SOM是通过关注在BRNN学习过程中获得的具有更高ARD参数的基于这一确认,我们检查了每种情况下每个大脑区域的体积波动。 我们还使用了部分修改的“SOM_PAK”SOM还需要在训练时指定一些计算条件。我们通过考虑当前训练数据的样本大小和输入变量的数量来建立这些条件,与我们传统的研究条件相比。因此,我们将节点数设置为1200(40 30),50,000次学习迭代,邻域半径为40,学习率为0.15,并在本研究中作为邻域函数的泡沫函数。4. 结果4.1. 用监督学习方法(BRNN和SVM)通过在72名MS患者和21名HC中使用55个脑体积片段训练BRNN和SVM,通过LOO计算的每个样本组的MS预测率分布如图2中的box图所示。尽管在两种模型中HC和RRMS组的MS预测率分布范围中观察到轻微重叠,但主要是单独预测,因为在盒中的第一或第三四分位数中没有重叠。此外,在两种模型中,PMS组的预测率略高于RRMS组,PMS组的疾病严重程度更高。在比较BRNN和SVM,BRNN的预测率的分布显示HC和MS组之间的分离程度更大。我们通过绘制ROC曲线来评估两种模型的准确性(图1)。(3)并确认它是图二. BRNN和SVM交叉验证计算的各组MS预测率分布的BoXHC组用绿色表示,RRMS组用粉红色表示,而红色图表示PMS组。离群值([第三或第一]四分位数[+或-] 1.5 * 四分位数间距)绘制为圆圈,而极端离群值([第三或第一]四分位数[+或-] 3 * 四分位数”(《星战》)附加到离群数据点的字符串表示每个数据的患者编号图三. 使用所有55个分段为MS预测率生成的ROC曲线。给出了两种模型的AUC。合并RRMS、SPMS和PPMS患者作为真阳性,并针对HC作图作为真阴性。BRNN比SVM高我们还使用从基于Youden指数的ROC曲线获得的预测率阈值(截止值)来确认每组的正确率(表3)在表3中,BRNN的灵敏度为77.8%,而特异性为95.2%,当临界值设定为0.72时;同样,SVM的灵敏度为73.6%,而特异性为85.7%,当临界值设定为0.81时。基于这些结果,BRNN在灵敏度和特异性方面优于SVM,具有更高的特异性(HC组的正确率)95.2%,表明该模型中只有一个假阳性为了阐明实际身体残疾的严重程度与MS预测率的强度之间的关系,我们将72名MS患者和21名HC的EDSS评分绘制在纵轴上,MS预测率绘制在横轴上(图4)。在该图中,我们将HC组的EDSS评分指定为0,因为EDSS的定义来自0(无症状)至10(MS死亡),间隔为0.5。结果表明,虽然少数患者的预测率高,EDSS评分低,但几乎没有患者的预测率低,EDSS评分高。因此,如果计算的MS预测率低,至少身体症状相对较轻。 另外我们也证实了皮尔森BRNN预测MS的准确率与EDSS评分的相关系数为0.413(p0.000039),而SVM为0.319(p 0.001809)。在基于这些结果的BRNN和SVM模型的比较中,BRNN在准确性和相关性预测结果与肢体残疾严重程度之间的关系为了确认哪些大脑区域体积有助于分类,我们使用BRNN中的ARD参数研究了每个片段的权重。图5示出了以权重降序排列的片段的图。在55个脑节段中,WM-低信号表示相当于总重量的20%的最大重量值。前五个(包括WM-低强度)节段(左小脑DC、左外侧小脑、左小脑白质、右小脑皮质)的挥发性较大,约占总重量的50%。然后,增加和减少变得更加平缓,第16段和随后的段的波动率几乎持平,不到10%,前15段占总重量的三分之二。此外该S. Aoki等医学信息学解锁26(2021)1007666表3使用所有55个脑体积段的每组中两种模型的最佳MS预测率阈值、灵敏度、特异性和总正确率的列表。根据Youden指数从ROC曲线获得保留值MS预测率正确率灵敏度特异性RRMS(n= 59)PMS(n= 13)HC(n= 21)总计(n= 93)BRNN(55段)0.7274.6%95.2%77.8%百分之九十五点二SVM(55段)0.81百分之七十一点二85.7%76.3% 73.6%百分之八十五点七见图4。EDSS评分(指示MS所致身体残疾的严重程度)与计算的MS预测率之间关系的散点图。HC组用绿色表示,RRMS组用粉红色表示,而红点表示PMS组。BRNN的相关系数r=0.413,=0.319。图五、从BRNN中的ARD参数获得 的按权重降序排列的段的图。仅使用这15个分段的监督学习(BRNN,SVM)的结果示于表4和图6中。BRNN的灵敏度提高了6.9%,另外5名MS患者得到了回答正确SVM显示准确度几乎没有变化,另外一个HC回答正确;然而,一个MS变为假阴性。表5显示了用于比较BRNN的混淆矩阵表4最佳MS预测率阈值、灵敏度、特异性和每组中两种模型的总正确率的列表,使用ARD脑体积的前15个部分。根据Youden指数从ROC曲线获得保留值MS预测率正确率灵敏度特异性RRMS(n= 59)PMS(n= 13)HC(n= 21)总计(n= 93)BRNN(15段)0.71百分之八十三点一95.2%87.1% 84.7%百分之九十五点二SVM(15段)0.76百分之六十九点五90.4%76.3% 72.2%百分之九十点四S. Aoki等医学信息学解锁26(2021)1007667见图6。使用ARD前15个区段为MS预测率生成的ROC曲线。给出了两种模型的AUC。合并RRMS、SPMS和PPMS患者作为真阳性,并针对HC作图作为真阴性。表5用于比较BRNN和SVM的混淆矩阵,使用所有55个分段和ARD前15个 分段。1. BRNN(使用所有55个分段)2.SVM(使用所有55个段预测数不是一个清晰的聚类,因为它周围的颜色是苍白的,并且混合了一些RRMS样本;因此,在此计算中使用的55个段中的许多段可能已经充当了噪声。另一方面,与HC簇相比,PMS簇周围的颜色较暗。这揭示了PMS聚类显示出片段值的显著波动(即,大脑区域体积),这消除了这些噪声影响。我们仅使用图8所示的BRNN中ARD参数的前15个片段构建SOM。虽然图8中的SOM比图7中的少40个片段,但聚类模式明显强于图7。在地图左下方的HC组聚类中,边界颜色较暗,并且混合的RRMS样本少于图7中的那些。为了确认图上实际分段值的分布,我们输出了图9所示的分量平面。如“方法”部分所述,分量平面将每个贴图节点中单个矢量分量的值可视化为红色(高值)和蓝色(低值)。随着疾病的进展,从HC组到RRMS组和PMS组,逐渐观察到每个脑体积的波动模式的显著变化。此外,在显示取决于特定段的值的过渡的灰度中注意到差异。例如,通过关注WM低强度的分布,HC组聚类指示相对较低的片段值。同样,PMS组的值较高,RRMS组的值介于前两组之间。例如,WM-低强度分布显示HC组簇具有相对低的值,而PMS组具有较高的值,RRMS组具有介于前两者之间的中间值 组 的 分布 的 左心室DC 显示出相似倒置 模式(高 在 HC,低, PMS) 到WM-低强度;然而,分布的变化较为平缓。这种差异表明HC组和RRMS组的左室DCs分布重叠多于WM低信号。表6示出了从分量平面确认的每个聚类中的15个脑体积段中的实际MSMS健康56 16实际MSMS健康53 195. 讨论健康1 20健康3 183. BRNN(使用ARD前15个分段)4.SVM(使用ARD前15个分段)预测数在本研究中,通过使用人工智能方法对MS患者组和HC组中的55个脑体积段进行训练,可以仅使用从MRI图像获得的脑体积数据。 一个构建的预-实际MS健康MS健康61 11实际MSMS健康52 20BRNN诊断模型的敏感性为77.8%,特异性为95.2%,总准确率为81.7%。在这个BRNN学习过程中,1 20健康2 19和SVM,使用所有55个段和ARD前15个段。基于所获得的结果,我们专注于这15个部分,并进行了无监督学习分析。4.2. 用无监督学习方法(SOM)我们在图7中显示了通过输入所有55个脑段训练的SOM。在随后的SOM中,HC的每个数据样本用绿色数字表示,RRMS用粉红色数字表示,PMS(SPMS和PPMS)用红色数字表示,作为样本数据标签。关于命名规则,命名数据标签文本以包括关于数据类别(RRMS(R)、PMS(P)或健康对照(C))和患者编号(nc*)的信息。在SOM上,每个数据样本的距离用黑白的深浅来表示,颜色越深,实际数据的差异越显著,即距离。图7显示,即使使用所有55个片段训练SOM,渐进的MS组在地图的左上方形成一个集群,HC组聚集并分布在右侧。这一结果表明,在形成集群的55个片段中存在具有相似趋势的特征。然而,SOM上的这个HC组群集是脑体积的前15个部分被判断为强烈地参与ARD的分类。基于这些结果,我们训练SOM,一种无监督学习方法,仅使用这15个片段,并确认从所有55个片段制备的SOM中聚类形成的程度增加。这些结果表明,在所有55个段中,许多段在分类中成为噪声。这一建议得到了BRNN在计算中使用15个段的改进精度的支持。这种改善可能归因于不太重要的节段的不可避免的轻微影响,即使当使用所有55个节段时ARD是足够的。另一方面,即使只有15段,SVM也没有提高精度使用了一些元素然而,关注ROC的AUC,观察到面积略微增加(0.819-0.841),表明准确度提高。基于这些结果,ARD的 加 权 函 数 在在这项研究中,与SVM相比,15个片段在BRNN的准确性中起着重要作用。BRNN和SVM计算的MS预测率与EDSS评分相关,EDSS评分代表身体残疾的严重程度。这种相关性表明该模型的合理性,因为更大的音量波动与更严重的身体残疾。这结果与先前的发现[11即使在复杂的模型中,S. Aoki等医学信息学解锁26(2021)1007668见图7。SOM通过输入所有55个脑体积段进行训练。地图上的字符串表示数据标签;绿色标签是HC组,粉色是RRMS,红色是PMS组。该标签 包 括 数 据 类 别 ( RRMS ( R ) 、 PMS(P)、健康对照(C))和患者编号(nc***).在SOM中,每个数据样本的距离由黑白的阴影表示;颜色越深,实际数据的差异越大。尽管具有相似特征的数据经过竞争性训练以彼此接近,但为了清楚起见,我们在适当的聚类区域周围绘制辅助线(绿线表示HC,红线机器学习方法图8.第八条。 SOM使用BR N N 中 AR D 参 数 的 前15段。扩大与大脑萎缩进展因此,我们认为,越高由15个段训练的SOM中的PMS聚类被认为与BRNN的ARD的分类相关;该聚类具有七个递增的段值(WM(非WM)_hypointensities,Left(Right)_Lateral_specticle, 左侧_Inf_Lat_Vent, 第五章, CSF)为基础在组件平面上。首先,白质和非白质低信号区(WM-和非WM-低信号)的高值段意味着这些区域的水和空气增加,脂肪减少(在T1加权图像上,水和空气显示为暗区(低信号),而脂肪为亮区(高信号))。因此,这表明PMS中的萎缩进展严重,并且从RRMS到PMS,萎缩进展的程度变得更加突出。第二,心室段的高值(左(右)_外侧_心室、左_内_外侧_心室、第五心室) 意味 的 这些 地区 失去 湿气, 和 它们的体积在SOM中观察到的更接近PMS簇的脑室值可能反映了脑萎缩时脑室的扩张。同样,与前一点相结合,脑脊液(CSF)的节段由于脑萎缩和静脉的水分流出而增加。因此,认为该节段剩下的八个部分被假定为准确反映脑区域萎缩的实际体积,并且当从HC簇接近PMS簇时,段的值略微降低。本研究中获得的脑萎缩结果与先前报告的MS脑病变内容一致[13,17,54,55];因此,认为通过机器学习方法建立的分类模型准确反映了这些数据的结构然后,我们确认了各组脑体积的分布,S. Aoki等医学信息学解锁26(2021)1007669见图9。图8所示为伴随SOM的15个段值的分量平面。地图的布置与图8中的布置相同,而每个地图节点上的每个值的分布对于相对高的值显示为红色,对于低值显示为蓝色更多细节例如,在SOM的组成平面上,从HC簇到RRMS簇,观察到左(右)间脑(左(右)-间脑DC)的分布更渐进。由于先前的研究报告这些区域在MS的早期阶段萎缩[13,56],因此假定这种验证的分布反映了这些发现。也证实了具有类似分布的其他节段,即右丘脑(右丘脑-固有 ) 、 侧 脑 室 、 CSF 和 总 脑 容 量 , 不 包 括 脑 室 ( BrainSegVolNot-Vent)。这种分布模式对于区分HC和RRMS组是重要的;因此,这四个区域可能是从MS早期波动的区段。HC组和RRMS组之间无显著差异,但PMS组中具有显著波动模式(如非WM低信号和左下角侧脑室(左-内-外-通气))的分布值被认为提供了区分RRMS组和PMS组的重要信息。换句话说,这些节段面积直到脑萎缩显著进展时才开始减少,因此,可能是进展阶段变化的指标。这些萎缩模式相对容易理解,并且在HC和PMS集群之间对称分布。相反,在RRMS聚类中观察到显著的个体差异,S. Aoki等医学信息学解锁26(2021)10076610表6图8所示SOM上每个群集(左下(HC)、中央部分(RRMS)和右上(PMS))中每个脑体积的波动模式,从组成平面(图9)得到确认。段变量名HCRRMSPMSWM-低强度低中间高左胸DC中高中间低左外侧髁低中间高左小脑白质中间低高中低右侧-小脑-皮质中间低高低非WM低信号低中低高左下呼吸道低中低高右丘脑-本体中高中间低右侧-小脑-白质中间低高中低第五类低低低高右向DC中高中间低CSF低中间高右外侧柱低中间高左侧-小脑-皮质中间低高低BrainSegVolNotVent高中高低如某些段的分布值波动幅度与PMS聚类相同,而某些样本的分布值与HC聚类相同。具体而言,SOM右下方RRMS群的值分布模式与PMS群的值分布模式接近;然而,由于该区域混合了3名SPMS患者,因此可能是PMS群的边界区域,而不是RRMS群。需要进一步的研究来证实这些结果,例如跟踪个体样本中相关簇区域的后续病理转变。本研究有几个局限性。这是一项在有限的日本MS患者样本中进行的单中心研究;因此,获得的结果可能受到选择偏倚的影响。此外,该分类方案可能不适用于其他队列,因为日本MS患者的临床病程可能略轻[57],萎缩率低于白人患者[58]。尽管本研究中认为存在种族差异,但我们从分析中排除了有视神经肌萎缩病史的患者,这在亚洲比西方国家更常见,其与MS的区别存在争议[7],以减少这种偏倚。此外,样本量相对较小,模型是根据从93个样本中收集的数据构建的。例如,通过深度学习从原始图像中进行图像识别需要各种数据(大样本量)来从大量信息中提取复杂的内部结构[59]。然而,没有采用深度学习方法,并且本研究中使用的数据是通过将MRI图像处理为每个体积值获得的;因此,我们得出结论,在本研究中,从93个样本中获得的数据是足够的。此外,在以前检查过的内分泌疾病中,我们发现-不情愿地 构造 模型 与 的 能力 到 预测库欣氏从79个样本的26个临床实验室检测值中获得高准确度的综合征[26]。这些发现表明,根据数据的特性,即使样本量不大,也可以充分构建预测模型。根 据 本 研 究 的 结 果 , 一 名 健 康 受 试 者 ( nc305 ) 在 所 有 三 个(BRNN,SVM,SOM)模型中均为假阳性,是年龄最大的样本,年龄为68岁。这意味着这种模式不能完全适应年龄的变化。此外,在本研究中,使用HC组和MS患者组阐明了MS组脑容量波动的特定模式;然而,预测疾病对照组的准确性仍不清楚,这需要在实际临床条件下进行鉴别诊断。此外,虽然该模型可以通过输入脑体积值快速计算,但在MRI图像中将需要更多的自动化以将脑体积、预处理和输入过程应用于实际临床实践。最后,与以前使用图像识别的研究相比,该模型的准确性相对较低方法.未来的研究需要通过增加HC样本量、准备具有不同特性的测试数据(即,疾病控制),添加脑体积的时间序列数据以扩展模型,并评估准确性。6. 结论在本研究中,我们构建了一个模型,区分HC和MS组之间的基础上,从MRI图像获得的节段的脑体积。虽然传统的脑容量研究仅在统计学上比较了特定的大脑区域,但我们在此使用机器学习方法,以一种简单的方式构建了这些多变量波动的定量模型。如上所述,认为该模型的MS预测率输出反映了与MS进展相关的脑萎缩状态。因此,考虑到目前MS医疗尚无特异性标志物,这一MS预测率有可能成为一个可量化的伪标志物,根据其值的大小程度来评估疾病进展的程度,而不仅仅是作为分类的阈值。本模型有一些局限性,如年龄变化的程度和疾病对照组时的准确性,如上所述。然而,这种方法不包括个别医生的主观评价, 为MS医疗保健提供一个关键指标,这是很难诊断的。竞合利益作者声明以下经济利益/个人关系可能被视为潜在的竞争利益:本工作得到MHLW计划资助号20 FC 1030和JSPS KAKENHI资助号20 K 07892的支持。确认作者感谢MedicalEnglishServiceLtd.和Editage(www.editage.com)对本手稿进行英文校对和编辑这项工作得到了MHLW计划资助号20FC1030和JSPS KAKENHI资助号20K07892的支持引用[1] Longo DL,Fauci AS,Kasper DL,et al. Harrison's Principles of Internal Medicine.18ed. New York:McGraw-Hill; 2012.[2] Ascherio A,Munger KL.多发性硬化症的流行病学:从危险因素到预防。SeminNeurol 2016;36(2):103-14. https://doi.org/10.1055/s-0036-1579693.[3] Reich DS,Lucchinetti CF,Calabresi PA.多发性硬化 新英格兰医学杂志2018;378(2):169-80。https://doi.org/10.1056/nejmra1401483网站。[4] McDonald WI,Compston A,Edan G,Goodkin D,Hartung HP,Lublin FD,et al.多发性硬化症的推荐诊断标准:国际多发性硬化症诊断专家组。《神经学年鉴》2001;50:121-7。https
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 前端协作项目:发布猜图游戏功能与待修复事项
- Spring框架REST服务开发实践指南
- ALU课设实现基础与高级运算功能
- 深入了解STK:C++音频信号处理综合工具套件
- 华中科技大学电信学院软件无线电实验资料汇总
- CGSN数据解析与集成验证工具集:Python和Shell脚本
- Java实现的远程视频会议系统开发教程
- Change-OEM: 用Java修改Windows OEM信息与Logo
- cmnd:文本到远程API的桥接平台开发
- 解决BIOS刷写错误28:PRR.exe的应用与效果
- 深度学习对抗攻击库:adversarial_robustness_toolbox 1.10.0
- Win7系统CP2102驱动下载与安装指南
- 深入理解Java中的函数式编程技巧
- GY-906 MLX90614ESF传感器模块温度采集应用资料
- Adversarial Robustness Toolbox 1.15.1 工具包安装教程
- GNU Radio的供应商中立SDR开发包:gr-sdr介绍
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功