机器学习预测房颤患者抗凝控制的临床实践研究：英国Datalink研究

89 浏览量更新于2024-01-09 收藏 863KB PDF 举报

医学信息学

机器学习算法

身份认证购VIP最低享 7 折!

30元优惠券

医学信息学解锁25（2021）100688使用机器学习预测房颤的：英国临床实践研究Datalink研究JasonGordon a，*，Max Norman a，Michael Hurst a，c，Thomas Mason a，b，CarissaDickerson a，Belinda Sandler c，Kevin G. 波洛克c，乌斯曼法鲁基c，劳拉格罗夫斯a，卡门曾a，放大图片作者：DavidClifton d，Ameet Bakhai e，Nathan R. 希尔ca卫生经济学和成果研究有限公司，联合王国b英国曼彻斯特大学生物、医学与健康学院健康科学学院cBristol Myers Squibb Pharmaceutical Ltd，Uxbridge，UKd英国牛津大学工程科学系英国伦敦皇家自由伦敦NHS基金会信托心脏病科A R T I C L EI N FO保留字：机器学习无监督学习心房纤颤心律失常抗凝控制国际标准化比值A B S T R A C T目的：研究机器学习（ML）算法用于估计接受华法林治疗的房颤（AF）患者抗凝控制方法：这是一项2007年至2016年成人患者（≥18岁）的回顾性队列研究，使用链接初级和二级护理数据（临床实践研究数据链GOLD和医院事件统计）。探索了各种ML技术来预测次优抗凝控制，定义为<基于国际标准化比值（INR）2.0-3.0的治疗范围（TTR）70%的时间。基线（线性和非线性支持向量机;随机森林;随机梯度增强[XGBoost];神经网络[NN]）和时变数据（6周间隔至30周（长短期记忆[LSTM] NN））应用。描述华法林治疗（LOT）的独特线的患者记录被分为训练集（70%）和保留集（30%），分别用于模型训练和测试结果：35，479例患者符合入选条件，其中24，684例和10，795例被分配到培训组（32，683例独特LOT）和保留组（14，218例独特LOT）。在所有模型中，抑郁（诊断和/或抗抑郁药物处方）是预测抗凝控制的重要驱动因素。在基线时，XGBoost是性能最好的模型（曲线下面积[AUC]：0.624），因为它能够识别非线性关联，例如年龄和体重（次优控制的较大概率：65和>8070公斤）。向LSTM NN添加时变数据改善了预测性能，在30周时AUC为0.830时达到稳定。结论：ML算法显示出临床上有用的能力来预测处于次优控制的更大风险的患者。将时变数据添加到算法中，特别是先前的INR测量，提高了预测性能。这些算法提供了改进的预测工具，用于识别可能从更频繁的INR监测或改用替代疗法中获益1. 介绍心房颤动（AF）–血液汇集心房 AF 可以进一步分类为瓣膜性或非瓣膜性房颤（NVAF），分别基于是否存在的中度到严重二尖瓣阀疾病（通常风湿性）或人工心脏瓣膜置换术[2]。这种血液汇集增加了血栓的风险。因此，AF患者的血栓栓塞性卒中风险增加了5倍[3]，并且与无AF患者相比更有可能发生更严重的卒中，导致卒中相关发病率和死亡率风险增加[4，5]。因此，建议大多数AF患者使用口服抗凝剂（OAC），以降低* 通讯作者。卫生经济学和成果研究有限公司，Rhymney House，Unit A Copse Walk，Cardiff Gate Business Park，Cardiff，CF23 8RB，UK。电子邮件地址：jason. heor.co.uk（J.Gordon）。https://doi.org/10.1016/j.imu.2021.100688接收日期：2021年3月4日;接收日期：2021年7月26日;接受日期：2021年7月30日2021年8月1日网上发售2352-9148/©2021的自行发表通过Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证（http://creativecommons.org/licenses/by-nc-nd/4.0/）中找到。可在ScienceDirect上获得目录列表医学信息学期刊主页：www.elsevier.com/locate/imuJ. Gordon等人医学信息学解锁25（2021）1006882≥血栓形成和伴随的缺血性卒中风险[6]。Warcantine是一种基于维生素K拮抗剂（VKA）的抗凝剂，自20世纪50年代以来一直在临床上使用[7]，新的直接OAC（DOAC）[8目前用于预防NVAF患者的卒中和全身性栓塞[12在许多情况下，这是因为患者不适合DOAC治疗（例如，由于重度肾损害），而在其他情况下，这是由于临床医生或患者的偏好[16，17]或药物成本。对于华法林是临床有效的，大多数患者是rec-建议保持在较窄的治疗范围内（国际标准化比值（INR）在2.0和3.0之间）。由于与华法林的各种饮食和药物相互作用[18]，患者需要定期和频繁的INR监测，这对医疗保健服务来说是资源密集型的，对大多数患者来说是负担INR的长期控制可以使用治疗范围内的时间（TTR）进行量化，TTR通过确定患者在范围内的时间比例来确定，通常使用Rosendaal方法[19]在已知INR测量值之间进行线性插值来实现。 INR控制欠佳与以下风险增加相关：不良结局; TTR 40%的患者的死亡风险为与未接受抗凝治疗的AF患者相似[20]。因此，在临床医生决定时，准确预测哪些患者可能具有次优华法林控制的方法因此可能更适合DOAC治疗或更频繁的INR监测（如果使用华法林），这对临床医生和患者都是有益的。传统统计方法（如回归建模）已用于识别与次优抗凝控制高风险相关的患者因素，然而，TTR中不可预测的个体间变异性等因素会影响这些方法的性能[21，22]。人工智能（AI）方法（如机器学习（ML））可能比传统的基于回归的模型更准确，能够识别单个和多个时间点变量之间的复杂非线性关联[23]，目前正在多个疾病领域进行评估，以改善许多疾病的诊断和管理。机器学习技术已被用于开发算法，以改善AF的筛查和检测。这些技术涉及对电子病历中包含的常规收集数据进行筛查，以识别应接受进一步筛查的未确诊AF风险最高的患者[23，24]，或将ML算法应用于心电图（ECG）迹线，以检测波形与AF相关的变化[25机器学习技术-还开发和评估了一些药物，以优化华法林降低与治疗相关的药物不良事件风险的给药方案[29在评价传统统计方法和ML技术的研究中，ML技术在优化华法林剂量方面几乎没有或没有额外获益[32，33]。然而，这些研究中没有一项是专门针对...所有AF患者均未将INR控制作为主要结局。临床上用于预测AF患者INR控制不良风险的一种工具是SAMe-TT2 R2评分[35]。该工具使用线性回归开发，以识别与INR控制不良相关的临床变量，并用于识别华法林不太可能达到最佳INR控制的患者，这些患者可能更适合DOAC治疗[6]。然而，对16项评价SAMe-TT2 R2评分临床有用性的研究进行的荟萃分析得出结论，虽然该评分能够预测次优INR控制（低TTR），但其在个体患者中的使用过于有限，无法提供临床有用性[36]。最近发表的一项研究利用ML技术开发了基于AF患者连续INR测量的临床结局预测模型[37]。治疗前30天内的INR测量值用于预测大出血、卒中或全身栓塞，以及此后长达12个月的全因死亡率。ML模型在预测不良临床结局方面优于TTR，虽然在预测接受华法林治疗的AF患者的不良临床事件方面有价值，但在识别INR控制不佳的高风险患者（可能会或可能不会继续经历不良事件）的方法方面也有价值。我们不知道有任何工具或算法因此，我们试图评估不同ML算法对英国接受华法林治疗的NVAF患者抗凝控制评估的相对预测性能。本研究对知识的贡献包括：基于基线和/或时变数据评价不同ML方法在预测接受华法林治疗的NVAF患者INR控制欠佳风险方面的性能确定基线时和随时间推移预测INR控制欠佳的论文的其余部分组织如下：第2节概述了研究方法;第3节介绍了结果;第4节讨论了研究结果和影响以及局限性。2. 方法2.1. 研究设计这是一项在2007年1月1日至2016年12月31日（研究期）期间开始接受华法林治疗的NVAF患者中进行的回顾性队列研究，使用常规收集的电子初级和相关二级保健的健康记录。数据来自临床实践研究数据链（CPRD）GOLD数据库，该数据库包含来自英国全科医生实践的1130多万患者的匿名医疗记录[38]。CPRD提供了与医院事件统计（HES）数据库中的二级护理数据相关联的初级护理数据[39];目前英国参与CPRD的GP实践中约有60%存在关联[38]。该研究数据集还包含来自国家统计局死亡登记的相关死亡率数据，以及全科医生实践水平（多次痴呆指数）和患者水平（汤森痴呆指数，仅适用于英格兰）的剥夺数据。CPRD是世界上来自初级保健的纵向医疗记录的最大数据库之一[40]，并且越来越多地被欧洲研究人员使用，因为英国初级保健人群的人口统计学特征与许多欧洲人群相当[41，42]，因此研究结果被认为具有高度的普遍性。研究方案（18_187 R）于2018年8月22日获得药品和保健品管理局独立科学咨询委员会的批准。2.2. 患者如果成年患者（18岁）在研究期间具有Read（初级保健）或疾病和相关健康问题国际统计分类第10版（ICD-10）（二级保健）AF（或房扑[AF/F]）诊断代码，并且在AF诊断后具有随后的英国国家处方集（BNF）华法林治疗代码，则纳入该患者。如果患者符合以下标准中的至少一项，则将其排除：研究期前AF/F的Read或ICD-10代码; AF诊断前肺栓塞、深静脉血栓形成、二尖瓣疾病或瓣膜手术的诊断（即后两种适应症排除了不适合DOAC处方的瓣膜性AF患者）; AF诊断前>3个月华法林的BNF代码;开始华法林治疗前DOAC治疗的BNF代码;6个月内INR测量少于2次开始华法林治疗后≥6周;登记于··J. Gordon等人医学信息学解锁25（2021）1006883≥在AF诊断前12个月参与CPRD的全科医生实践;或在AF诊断前12个月的最近一次CPRD达标（UTS）日期。2.3. 数据管理数据提取自2019年CPRD GOLD数据库。提取基线人口统计学、合并症、体重指数（BMI）、酒精、吸烟、处方、初级保健相互作用、记录的CHA2 DS2- VASc评分和相关数据。使用现有患者数据重新计算CHA2DS2-VASc评分。在重复评分的情况下，使用最近的评分。在数据清理前对单位进行标准化，并根据补充表S1中列出的预定义数据范围删除认为不可信、无效或临床不可行的数据点。此外，记录的患者注释（例如;>）被排除。如果可能，估算对缺失值进行分析，包括BMI（如果身高和体重已知）、脉压（如果收缩压和舒张压已知）、总胆固醇（TC）（如果高密度脂蛋白（HDL）和/或低密度脂蛋白（LDL）已知）、胆固醇比率（如果TC和HDL或LDL已知）和酒精摄入类别（如果每周单位已知）。每种治疗线（LOT）的索引日期为华法林开始治疗的日期，每种LOT持续至以下最早日期：1）2016年12月31日;2）死亡; 3）GP实践不再有助于CPRD; 4）患者从GP诊所转出; 5）华法林停药（从既往处方结束日期开始，供应间隔90天）。如果患者在符合停药标准后有后续记录的华法林处方，则认为这是一种新的华法林治疗。符合条件的患者被分成两个数据集;训练集（70%）用于训练模型，而holdout（测试）集（30%）用于评估每个模型的预测性能。在患者水平而不是按批次进行所有拆分，因此所有批次均分配至同一数据集。10-折叠交叉验证重复三次以定义模型超参数、模型调整和特征选择。所有分析均在R 3.4或更高版本中进行2.4. 变量定义使用个体水平TTR评价抗凝控制，TTR定义为稳定期后患者INR在每线华法林治疗中计算为2.0 - 3.0的天数比例。在前42天内的INR测量，考虑到-排除了稳定期。 TTR的计算方法如下：线性插值（基于Rosendaal等人[19]），TTR阈值70%被定义为次优INR控制[22]。除TTR外，还根据治疗范围（TOR;即INR> 3.0）和治疗范围（TUR;即INR 2.0）以下的时间对抗凝控制进行了进一步分类[22]。高TOR使患者发生出血相关事件的风险更大，而低TOR患者发生出血相关事件的风险更大。显著的TUR使患者面临更大的凝血相关事件风险。TOR或TUR阈值>15%被定义为次优INR控制，选择为>70%TTR的最佳范围两侧的剩余区域[22]。TUR和TOR并不相互排斥，高度可变的INR测量可以具有高TOR和TUR。2.5. 预测抗凝控制为了开发预测模型，从文献[22，43]和临床专家意见中识别抗凝控制的已知风险预测因子，以创建最大特征集。其中包括一系列人口统计学变量、临床指标、健康行为、合并症和药物使用，如补充表S2所列。使用常规统计（逻辑回归）和ML方法开发预测模型，以确定基线（定义为华法林开始日期）时患者人口统计学和临床特征与次优INR控制之间的关系。一还开发了随时间变化的ML模型，以探索基线和时间依赖性数据对患者特征与索引日期后6周间隔的次优INR控制之间关系的影响。对于所有预测模型（除了神经网络（NN）），INR控制的二进制测量（即，次优控制与最优控制）作为主要结局。在NN模型中，使用INR控制（即TTR）的连续测量，TTR为70%定义为次优控制。使用受试者工作特征（AUROC）曲线下面积以及常见的ML性能值（包括灵敏度，特异性，阳性预测值[PPV]和阴性预测值[NPV]）和25%、50%和75%灵敏度的混淆矩阵。2.5.1. 基线logistic回归模型使用INR控制的二元测量对基线数据进行逻辑回归，将次优INR控制设置为阳性类别。使用GLM软件包应用逻辑回归模型 in R. logistic回归模型中包含的特征列表详见补充表S2。2.5.2. 基线机器学习（ML）模型评估了以下ML技术：随机森林; XGBoost;线性和非线性支持向量机（SVM）;和NN。之所以选择这些模型，是因为它们涵盖了不同的ML技术，允许评估线性和非线性关联。在模型开发过程中，为每个模型构建了一个简化的特征集。该过程去除了任何非预测特征，以及与集合中的其他特征高度共线的任何特征。然后将各个功能集合并为一个单一的共同功能集。根据与目标变量的相关性（逻辑回归，线性SVM）或互信息（非线性SVM，NN MLP，随机森林，XGBoost）对所有特征进行排序，也就是说，次优 INR控制。的排名列表的特征的如果当前分数比最佳分数提高，则按顺序逐步通过，每个特征被添加到模型的特征集中。评分定义为通过交叉验证发现的平均AUROC曲线减去两个标准误差减去额外的小误差。值，ε。然后对功能集进行了评估。删除了保留但认为临床上不合理任何在个案基础上，对未保留但有强有力的临床证据支持纳入的特征每个基线模型中包含的特征列表详见补充表S2。累积局部效应（ALE）图被用来定量描述模型中的功能的影响ALE图被用于模型解释的这种视觉方法与其他方法相比是无偏的。2.5.3. 时变机器学习（ML）模型开发了一种长短期记忆（LSTM）递归神经网络（RNN），用于估计基线时和开始华法林治疗和INR控制后前6个月随访期间的INR控制情况。选择LSTM RNN是因为它能够随着时间的推移检查关联[44]。LSTM RNN在时间序列数据集上进行训练，该时间序列数据集从第0周（华法林开始的日期）到第30周的所有变量（INR测量值除外）的间隔为6周。从第6周至第30周，将时变INR测量值纳入LSTM RNN;不考虑华法林开始后前6周的INR数据，以稳定INR水平。稳定性能因起始剂量方案的临床选择、初始INR检测频率以及临床医生和中心之间的剂量变化而异。除了估计TTR之外，LSTM时变模型还同时估计TOR和TUR作为三个并发输出。J. Gordon等人医学信息学解锁25（2021）1006884==-=节点来稳定三个结果的预测。由于LSTM是在患者随访的早期阶段开发的，因此从先前记录的INR测量结果中获得了几个额外的特征包括稳定后阶段。包括每例患者的既往 T O R 和 T U R 以及患者 I N R读数与 2. 5 的偏差，即，从推荐治疗的中点范围，以及连续INR读数之间的平均差异。此外，LSTM模型被迫将患者的吸烟状况和饮酒量保留LSTM中使用的最终特征集在补充表S2中详细说明。3. 结果3.1. 患者特征35，479名患者有资格参加这项研究。对24，684例独特患者（训练集）进行分析，并对10，795例独特患者（保留集）进行评价。在训练集中，24，684例患者提供了32，683个独特的LOT;在10年研究期间，78%（n 19，279）的患者提供了1个LOT，15%提供了2个LOT，其余7%提供了3个或更多LOT。 13，843例（42.4%）LOT被归类为次优控制，18，840例（57.6%）被归类为最优控制。治疗持续时间与最佳对照相比，在定义为次佳对照的LOT中的时间更短（620.2 [置信区间[CI]：610.5906.1[CI：895.5-916.7]天）。所有患者的平均随访时间为778.2天（标准差[SD]：692.2天），平均INR控制欠佳的患者为614.2天（SD：583.7），INR控制最佳的患者为903.9天（SD：740.9）。按INR控制分层的人口统计学和临床特征总结见表1。在INR对照组中，患者年龄、BMI或种族无临床意义的差异，但是，显著的性别差异，基于TTR，男性表现出次优控制的比例更高（43.9%[男性] vs 41.4% [女性]; p 0.001）。<控制不佳的患者饮酒量增加12.0与10.2单位/周（p 0.001）相比，与医疗保健服务的接触更频繁（10.7次GP访视和0.42次住院，与<9.46 GP访视和每年0.31次住院; p 0.001），Townsend剥夺指数和CHA2DS2-VASc评分的分布均不如最佳INR控制的患者（p 0.001）。<<次优INR对照组患者的合并症患病率较高，如糖尿病、抑郁、焦虑、贫血、冠心病、心力衰竭、肺病和肾病，其中（与最佳INR对照相比，所有p均<0.001）。< 患者INR控制欠佳的患者在开始华法林治疗前3个月内更有可能接受抗抑郁药、抗生素、哮喘药物、地高辛、利尿剂和质子泵抑制剂的预先治疗（所有p <0.001 vs最佳INR控制）。<3.2. 基线logistic回归模型逻辑回归模型中包含的所有特征均显示与INR控制的统计学显著关系，抑郁是次优控制的最强预测因子。在索引日期前三个月内被诊断患有抑郁症或处方抗抑郁药的患者是索引日期前三个月内被诊断患有抑郁症或处方抗抑郁药的患者的约1.3倍（OR：1.324; 95%）。CI：（1.248-1.405）更可能到表现出次优 INR控制与没有这两者的患者相比。INR控制欠佳的另一个重要驱动因素是红细胞计数，单个单位增加与减少相关（OR：0.762; 95% CI：0.731，0.795）次优INR控制的概率（补充图S2）。logistic回归模型在25%、50%和75%灵敏度下的混淆矩阵总结见表2。该模型的AUROC为0.606。在75%灵敏度（即正确识别75%次优INR对照病例的阈值）下，正确标记为次优对照（真阳性[TP]），而5，040个被错误标记为次优对照（假阳性[FP]），导致阳性和阴性预测值（PPV和NPV）分别为47.9%和66.1%。3.3. 基线机器学习模型在评估的ML模型中，表现最好的模型是XGBoost，AUROC为0.624，紧随其后的是随机森林模型，AUROC为0.621，如表2和图1所示。用于NN（MLP）、SVM（r.b.f.）和SVM（线性）模型分别为0.618、0.617和0.605（补充表S2）。在XGBoost模型中，在75%灵敏度下，4，628（32.6%）个LOT被正确标记为次优对照（TP），而4，751（33.4%）个LOT被错误标记为次优对照（FP），导致PPV和NPV分别为49.3%和68.1%。在二元变量中，抑郁症在指数日期前五年内的任何时间或在指数日期前三个月内的抗抑郁药物处方0.0295）和哮喘（ALE0.232）是接下来的两个最重要的变量（补充图S1）。在连续变量中，饮酒量和年住院次数与INR控制欠佳的概率呈正线性相关，红细胞计数和白蛋白浓度呈负线性相关（补充图S2）。如图 2，XGBoost模型也能够识别非协变量（如体重和年龄）与次优INR控制之间的线性相关性。体重70 kg与次优控制的概率更大相关。与体重70 kg的患者相比，体重50 kg的患者出现INR控制欠佳的可能性高6.5%。从70到103公斤，关系是-体重和INR对照之间相对平坦。患者年龄与INR控制欠佳之间的关系呈<“ U 型 ” ， 65 岁或 > 80 岁的患者比 65 - 8 0 岁的患者表现出 IN R控制欠佳的可能性更大。3.4. 时变机器学习模型LSTM RNN模型纳入了基线ML模型中未包含的其他时变特征，即：时间依赖性吸烟状态;每年住院时间; CHA2 DS2-VASc评分;以及稳定后阶段的既往INR测量值（除TTR外，还包括TOR和TUR）。表3中显示了按距索引的周数（即，距华法林开始的周数）分层的时变LSTM NN模型的AUROC曲线和性能统计。在第0周（即基线时），性能（AUC 0.616）与其他基线模型相当。随着指数后时间的增加和更多的信息可用，模型性能显著增加，在第30周达到AUC 0.830，如图所示。3.第三章。表2总结了第30周时LSTM RNN在25%、50%和75%灵敏度水平下的混淆矩阵。在75%灵敏度下，4，628（32.6%）个LOT正确标记为次优对照（TP），而2，024（14.2%）个LOT错误标记为次优对照（FP），导致阳性和阴性预测值（PPV和NPV）分别为69.6%和79.6%。最终的LSTM模型包括三个不同的模块：1）基线信息，2）不包括INR数据的时变信息和3）时变INR数据。每个模块对最终模型的贡献如表3所示。虽然不含INR数据的时变模型（即仅包括：吸烟状态、每年住院时间和CHA2 DS2-VASc评分）的性能仅随时间略有改善，但在时变INR模块中纳入INR数据可在更大程度上改善性能。以案例研究的形式对这些结果进行了补充介绍，J. Gordon等人医学信息学解锁25（2021）1006885表1纳入训练集的24，684例患者的人口统计学和临床特征次优控制 *最佳控制 *p值†（n= 13 843）（n= 18 840）均值（SD）N（%）均值（SD）N（%）Welch患者人口统计学资料（LOT开始前5年内的最新值）年龄（岁）74.9（0.1）女性男性重量（kg）82.6（0.2）<高度（m）1.69（0.0）<体重指数（kg/m2）28.9（0.1）<红细胞（计数）4.5（0.5）4.6（0.5）0.001吸烟状况非吸烟者目前吸烟者吸烟者-6 022人（43.5%）-7 719人种族黑人亚洲人其他南亚白人未记录汤森贫困指数1人（最贫困）2345（最贫困）未记录-5 966人多重剥夺指数1人（最贫困）2345（最贫困）未记录人数-时间（AF诊断至开始华法林治疗;天）892.3（9.8）70%†用于次优和最优对照组之间的统计显著性检验^使用现有患者数据重新计算CHA2DS2-VASc评分在重复评分的情况下，使用最近的评分表2基线逻辑回归模型、性能最佳的机器学习模型和时变机器学习模型在周时的混淆矩阵在25%、50%和75%灵敏度下为0和30。最佳基线机器学习模型第0第30AUROC：受试者工作特征曲线下面积; FN：假阴性; FP：假阳性; LSTM RNN：长短期记忆递归神经网络; NPV：阴性预测值; PPV：阳性预测值; TN：真阴性; TP：真阳性; XGBoost：随机梯度增强。如补充图S3所示。4. 讨论训练集中42.4%的LOT存在INR控制欠佳接受LOT（定义为次优控制）的患者更可能是男性，更可能报告中度至重度饮酒，更可能被社会经济剥夺。酒精和华法林之间的相互作用是公认的[45，46]，而且--INR控制不佳[47]。此外，在基线时的所有模型中，INR控制欠佳的最大驱动因素是基于抑郁的标志物。在开始华法林治疗前5年内诊断为抑郁症的患者或在开始华法林治疗前3个月内处方抗抑郁药物的患者比没有这些标志物的患者表现出次优INR控制的可能性高约30%（基于logistic回归模型）。这些发现支持了那些AUROC灵敏度特异性TPFPTNFNPPVNPV传统模型Logistic回归（n= 14，218）0.606 25.0%百分之八十六点二1,5411,1106,9384,629百分之五十八点一60.0%50.0%百分之六十五点五3,0852,7765,2723,085百分之五十二点六63.1%75.0%百分之三十七点四4,6265,0403,0081,544百分之四十七点九百分之六十六点一XGBoost（n= 14，218）0.624 25.0%百分之八十七点七1,5439907,0584,627百分之六十点九百分之六十点四50.0%百分之六十七点一3,0852,6475,4013,085百分之五十三点八百分之六十三点六75.0%41.0%4,6284,7513,2971,542百分之四十九点三百分之六十八点一LSTM RNN（n= 14，218）0.616 25.0%百分之八十六点六1,5431,0756,9744,627百分之五十八点九60.1%J. Gordon等人医学信息学解锁25（2021）1006887Fig. 1. BoX图概述了交叉验证中涉及的每个模拟的性能（;训练集）和最终性能（×;保持集）。AUC：曲线下面积; MLP：多层感知器; NN：神经网络;RBF：径向基函数; ROC：受试者工作特性; SVM：支持向量机; XGBoost：随机梯度提升。其他研究表明焦虑和抑郁与INR稳定性降低相关，因此TTR降低[48，49]，使这些患者发生血栓栓塞或出血事件的风险增加。本研究中评估的大多数ML模型在预测AF患者的次优INR控制方面的数值优于传统统计（逻辑回归）方法。与传统统计方法不同，ML模型可以理解协变量之间复杂的相互关系，其中一些能够识别非线性关联。事实上，性能最好的ML模型使用基线数据-最佳ML模型的增量预测能力保持中等，并且反映了利用当前记录的初级护理数据预测处于次优INR控制的最高风险的患者的复杂性和挑战性。与仅基于基线数据的ML模型相反，时变ML模型允许在华法林治疗开始后的随访期间纳入额外信息。在这项研究中，将时变数据，特别是稳定后阶段的先前INR测量值引入LSTM RNN，显著提高了ML算法预测次优抗凝控制的性能。虽然随着时间的推移，这种性能改善的主要驱动因素是先前INR测量的可用性，不仅INR测量值本身有助于提高预测未来INR控制不佳风险的能力，而且INR测量值与其他协变量之间的关系也有助于提高预测未来INR控制不佳风险的能力。如图S3中的病例研究所示，ML算法识别出尽管既往控制最佳但未来控制不佳风险较高的患者，反之亦然。在这些突出显示的病例中，尽管患者有最佳控制史，但他们被确定为未来INR控制不良的风险较高（相反，有次佳控制史的患者被确定为未来控制不良的风险较低），随后通过数据证实了这一点。在这些情况下，临床医生单独评估既往INR测量值可能导致假设这些患者分别处于较低和较高的次优控制风险，尽管结果相反时变ML模型（LSTM RNN）表现出出色的预测能力（AUROC> 0.8）。最佳治疗疗效华法林是意识到当 INR保持不变表3最终LSTM RNN时变模型的AUROC性能和分解组件的性能 -按指数的周数分层。从索引开始的周数最终模型0.616 0.638 0.703 0.763 0.804 0.830分类模块仅基线信息与线性方法相比，其性能有所改善。总的来说，虽然这些结果表明，时变（无INR）0.605 0.607 0.613 0.619 0.627 0.632与使用基线数据的常规方法相比，大多数ML算法预测患者的次优抗凝控制时变INR 0.500 0.576 0.674 0.746 0.793 0.822INR：国际标准化比率图二. （左）随机梯度增强（XGBoost）基线模型权重的次优控制（基于局部效应，ALE）概率变化和（右）XGBoost基线模型次优控制概率随年龄的变化。（左）在基线： <70 kg-6，794 pa-例患者; ≥70 kg和110 kg≥60岁和85岁J. Gordon等人医学信息学解锁25（2021）1006888图3.第三章。时变长短期记忆递归神经网络（LSTM RNN）模型的受试者工作特征（ROC）曲线。在2.0-3.0之间。然而，为了确保INR维持在这个狭窄的范围内，患者必须定期到华法林诊所就诊。时变ML方法可用作华法林诊所的额外工具，根据患者当前的时间更新曲线，定期评估个体患者未来出现INR控制欠佳的可能性。确定为控制欠佳风险较高的患者可接受更频繁的INR监测，或在控制欠佳发生前转换为替代治疗。在COVID-19大流行期间，这一点尤其重要，许多患者正在从华法林转为DOAC，以根据国家指南提高抗凝监测ML技术之前已被研究作为优化华法林剂量的方法[29，30]和预测临床结局[37]。然而，我们所知道的唯一一项已发表的研究报告了AF患者中预测TTR或口服抗凝药物质量（SAMe-TT2 R2评分）的方法的开发，该研究未采用ML方法[35]。研究报告了SAMe-TT2 R2评分预测INR控制不良风险患者的可变能力，因此，最近对16项研究进行的荟萃分析得出结论，SAMe-TT2 R2评分在个体患者水平预测INR控制不良的临床效用有限[36]。虽然我们没有直接将SAMe-TT2 R2评分与本研究中应用的ML算法进行比较，但我们的结果表明，使用ML方法预测具有较高风险的患者比使用传统统计方法更有益。次优INR控制，特别是包含时变数据。然而，是否可以开发ML方法来准确预测哪些患者在开始华法林治疗前基线时INR控制不佳的风险较高，需要在现实世界的临床环境中进一步研究。这项研究的一个主要优势是，数据来自真实世界的初级保健和二级保健活动的虽然纳入>30，000名患者增加了协会的稳健性患者相关变量和次优INR控制之间的关系及其对其他人群的可推广性，该研究并非没有局限性。首先，由于这是一项回顾性数据库研究，因此分析和结论依赖于原始数据输入的准确性和完整性。残疾人权利委员会采取措施确保这一点，只提供研究质量的数据，但错误可能仍然存在。其次，只有大约60%的有助于CPRD GOLD的全科实践的患者记录与HES相关，这意味着整个数据集与二级护理记录的相关性第三，选择偏倚也可能发生，因为我们只纳入了有足够随访数据的患者（即，在开始华法林治疗后的前6个月内至少测量两次最后，饮食（例如：基于维生素K的食物）数据，抗凝反应中的新兴参数，如遗传变异和负责每例患者的抗凝服务和HAS-BLED评分（用于量化大出血风险）J. Gordon等人医学信息学解锁25（2021）10068892010年，但直到2014年后才在临床实践中广泛使用[50，51]–总之，在基线时，与传统方法相比，ML模型表现出更好的INR控制预测能力。纳入时变数据（特别是既往INR测量值）显著改善了ML方法在预测次优INR控制方面的性能，然而，不仅是INR测量值本身，还有INR测量值与其他临床特征之间的复杂相互作用可预测风险。这种随时间变化的ML算法可用作华法林诊所的额外工具，以常规评估患者未来出现次优INR控制的可能性。资金本研究由Bristol Myers Squibb Pharmaceutical Ltd Pfizer Inc.申办。&资助协议确保了作者作者贡献者G，UF，BS，NH，LG，DC和AB概念化并设计了研究。MN、MH和TM负责数据分析。所有作者均对结果的解释、手稿的准备和审查以及最终手稿的出版批准做出了贡献。同意数据收集完全是回顾性的，患者数据在交付给作者之前由临床实践研究数据链（CPRD）匿名。无直接患者接触，无需书面知情同意书。数据可用性数据不能公开共享，因为它们是临床实践研究数据链（CPRD）的财产。数据可根据许可协议从CPRD获得。竞合利益BS、KP、UF和NH受雇于百时美施贵宝（BMS）英国有限公司。JG、MN、CD、LG和CT是健康经济学和结局研究（HEOR）有限公司的现任员工，他们接受了BMS英国有限公司对本研究的资助。MH和TM在研究时是HEOR Ltd.的员工; MH现在受雇于BMS UK Ltd. DC与Biobeats Ltd.一起承担咨询工作Sensyne Health PLC的AB是没有持有任何股票，但参与了由Daiichi Sankyo、Pfizer、BMS、Bayer和Boehringer Ingelheim赞助的研究，并且是Daiichi Sankyo 、Pfizer、BMS、Bayer和Boehringer Ingelheim的顾问小组和发言人局的成员附录A. 补充数据本文的补充数据可在 https ： //doi 网站上找到。org/10.1016/j.imu.2021.100688。引用[1] 欧洲房颤抗凝协会（英国）。AF报告-房颤：预防A卒中危机2012 2018年1月26日。可从以下网址获得：http://www.preventaf-strokecrisis.org/[2] [10] CammAJ，Lip GY，De Caterina R，Savelieva I，Atar D，Hohnloser SH，et al. ESC房颤管理指南的重点更新：2010年ESC房颤管理指南的更新。由欧洲心律协会的特别贡献开发。欧洲心脏杂志2012;33（21）：2719-47。2012年。[3] Wolf P，Abbott R，Kanel W.房颤是卒中的独立危险因素：Fractionary研究中风1991;22（8）：983-8。[4] Lamassa M，Di Carlo A，Pracucci G，Basile AM，Trefoloni G，Vanni P，等. 欧洲房颤相关卒中的特征、结局和护理欧洲共同体中风项目）。中风2001;32（2）：392-8。[5] Marini C，De Santis F，Sunday S，Russo T，Olivieri L，Totaro R等。房颤对缺血性卒中发病率和结局的影响：来自一项研究的结果基于人口的研究。中风2005;36（6

下载后可阅读完整内容，剩余1页未读，立即下载

cpongm

粉丝: 5
资源: 2万+

机器学习预测房颤患者抗凝控制的临床实践研究：英国Datalink研究

使用机器学习识别心脏病预测

基于机器学习的心血管疾病预测系统研究

使用机器学习预测心脏病-研究论文

用机器学习的方法对帕金森病进行预测的研究目的和研究意义

写一篇机器学习预测疾病的研究背景

请详细说明利用机器学习预测糖尿病的研究内容和预期成果

钙钛矿材料与机器学习的研究国内外研究现状300

国内外使用机器学习对帕金森病进行预测的研究现状

cv::ml::TrainData::loadFromCSV

机器学习毕业设计选题

机器学习预测nba比赛结果

机器学习预测算法优劣

机器学习预测数值的过程

机器学习+抑郁症预测

python机器学习 预测分析核心算法 pdf

r语言机器学习 预测模型_使用机器学习模型预测心力衰竭

机器学习预测疾病模型怎么做

机器学习方向的医学影像研究意义

乳腺癌预测 机器学习

机器学习国内外研究概况

最新资源

python机器学习预测分析核心算法 pdf

r语言机器学习预测模型_使用机器学习模型预测心力衰竭

乳腺癌预测机器学习