没有合适的资源?快使用搜索试试~ 我知道了~
动态术后并发症风险评分框架:基于生命体征的实时预测和诊断优化
1839→→→DyCRS:动态可解释术后并发症风险评分文王美国宾夕法尼亚州匹兹堡卡内基梅隆大学wenw3@andrew.cmu.edu韩昭cs.cmu.edu宾夕法尼亚州匹兹堡卡内基梅隆大学庄洪磊伊利诺伊大学香槟分校Champaign,IL,USAhzhuang3@illinois.edu摘要尼拉夫·沙阿NorthShore University HealthSystem芝加哥大学普利兹克医美国伊利诺伊州芝加哥NShah2@northshore.org蕾玛·帕德曼美国宾夕法尼亚州匹兹堡卡内基梅隆大学rpadman@cmu.eduCCS概念早期识别存在术后并发症风险的患者可促进及时的检查和治疗,并改善健康结局。目前,由美国外科医生学会(ACS)开发的广泛使用的手术风险计算器在线网络系统使用患者的静态特征,例如,性别、年龄,评估术后并发症的风险。然而,反映患者实际术后身体状况的最关键信号通常是实时动态信号,包括患者的生命体征(例如,心率、血压)。在本文中,我们开发了一个动态的术后并发症风险评分框架(DyCRS),以实时的方式检测“高危”患者的基础上术后连续的生命体征和静态功能。 DyCRS基于隐马尔可夫模型(HMM)的适应性,其捕获隐藏状态以及可观察状态以生成实时、概率、复杂性风险评分。使用电子健康记录(EHR)对来自主要卫生系统的择期结肠切除术进行评估,我们发现DyCRS在检测有效性方面显著优于最先进的ACS计算器和实时预测器,平均精确召回曲线下面积(AUCPRC)增加了50.16%。在早期性方面,我们的DyCRS可以比临床医生的诊断平均提前15小时55分钟预测此外,我们的DyCRS可以提取可解释的患者分期,这与之前的医学术后并发症研究一致。我们相信,我们的贡献表明,开发一个更准确,更强大,更可解释的术后并发症风险评分系统,可以大大降低不良事件和医疗成本,使美国每年超过5000万例手术受益。本文在知识共享署名4.0国际(CC-BY 4.0)许可下发布。作者保留在其个人和公司网站上以适当的署名传播作品的权利WWW©2020 IW 3C 2(国际万维网大会委员会),在知识共享CC-BY 4.0许可下发布。ACM ISBN 978-1-4503-7023-3/20/04。https://doi.org/10.1145/3366423.3380253• 应用计算卫生信息学;·信息系统数据挖掘;·计算方法学机器学习。关键词实时风险评分;术后并发症;隐马尔可夫模型;可解释性ACM参考格式:王文,赵汉,庄红雷,尼拉夫·沙阿和瑞玛·帕德曼。2020年。DyCRS:动态可解释术后并发症风险评分。在网络会议2020(WWW '20)的会议记录,2020年4月20日至24日,台北,台湾。ACM,纽约州纽约市,美国,12页。https://doi.org/10.1145/3366423.33802531引言在美国有超过5000万例手术每年,手术住院费用上升到美国所有住院费用的30%以上卫生保健系统(国家卫生统计报告,2010年)。 并发症发生率介于6%-47%之间,尿路感染(UTI)的每例并发症平均成本介于675美元至2,800美元之间,手术部位感染(SSI)为27,000美元,呼吸机相关性肺炎超过50,000美元[22,29,35]。因此,术后并发症是医疗费用的关键驱动因素[3,13]。此外,没有并发症的术后患者不必要地引起显著的发病率和医疗保健支出[10]。早期识别有术后并发症风险的患者,及时准确地进行检查,可显著降低不良事件和再入院率[23,41]。目前最先进的术后并发症风险计算器是美国外科医师学会国家外科质量改进计划模型(ACS NSQIP模型[5,8])。ACS NSQIP是一个广泛使用的在线Web系统,如图所示1.一、这是一个国家性的、经过验证的、基于结果的、风险调整的和同行控制的项目,用于测量、基准测试和提高外科护理质量[8]。它是为术前评估而设计的,这在大多数手术之前是必要的。WWW王文,赵汉,庄洪磊,Nirav Shah和Rema Padman1840图1:术前风险评估ACS NSQIP手术风险计算器在线网络系统。择期手术,与患者讨论手术风险,确保患者适合接受手术[33]。它使用患者性别等)计算术后并发症的风险另一方面,术后实时评估也非常重要。术后患者可能处于非常脆弱的状态,容易因手术创伤而发生术后并发症[17]。 尽管在手术后密切监测患者的生命体征,但这在很大程度上依赖于临床医生从收集的数据动态中发现进一步并发症的潜在风险。如果不能及时发现并发症的征兆,健康状况将迅速恶化,甚至导致死亡[ 37 ]。因此,以实时方式自动测量并发症的风险对于改善早期诊断和避免相关不良事件是必要的。然而,ACS NSQIP模型在术后评估中不起作用,因为它缺乏动态和实时能力来捕获术后临床序列转换依赖性,因为它是静态和一次性预测模型。需要更好的方法来实时检测“高危”患者,以便及时进行术后评估。图2示出了用于实时术后并发症风险评估的示例系统。在常见的术后护理中,一旦手术完成,多个生命体征(例如,血压、白细胞计数等)的病人都是顺序和紧密的。此外,任何择期手术,病人在入院时会提供其基本资料(例如:性别、合并症)。我们的目标是根据这些连续的生命体征和患者的静态特征构建实时并发症风险评分。然而,在术后环境中构建实时风险检测系统首先,患者的并发症风险随时间变化,但它取决于所有先前的生命体征,因为生命体征之间存在强烈的顺序依赖性。因此,广泛使用的实时预测方法(例如, 滑动窗口方法[20,28,40])在测量长期依赖性方面受到限制,并且只能捕获固定持续时间内患者的健康状态变化。所以一些有意义的,图2:术后风险评估实时系统的输入和输出图示。可以丢弃可能对临床恶化提供信息的代表性临床状态其次,由于隐私问题,医疗数据,特别是手术数据非常稀少[30]。此外,医院维护手术电子健康仓库的成本很高,因为需要大量训练有素的工作人员来进行监测和记录[15]。因此,很难从有限的训练数据中训练出一个非常复杂的模型,比如基于深度神经网络的模型。更重要的是,该模型必须可为临床医生解释[11]。 它还应该与当前的医学研究结果相一致。 只有这样,临床医生才能信任模型[14]。我们的贡献。 在本文中,我们提出了一种动态可解释的术后并发症风险评分(DyCRS )框架,以实时检测“高危”患者。DyCRS能够根据患者的术后生命体征和静态特征(例如性别)生成实时、概率性并发症风险评分。DyCRS是基于隐马尔可夫模型(HMM)的适应具体而言,我们有以下四个贡献:从应用角度出发,与术前评估-ACS NSQIP风险计算器在线网络系统不同,我们提出了一个动态的术后风险评估框架DyCRS来生成实时风险评分。我们的系统给出的分数将来可以发送到临床医生的手机上。方便临床医生随时随地监测患者的风险从 方 法 论 的 角 度 来 看 , DyCRS 将 隐 马 尔 可 夫 模 型(HMM)的两种现有适应性结合在一起以适应我们的设置:在状态空间中捕获除隐藏状态外的可观察状态[2],以及除序列特征外的静态特征[32]。在此基础上,我们进一步开发了一个管道,将离散的隐藏状态转换为连续的风险评分。我们评估了DyCRS的有效性,1. 机器学习和深度学习实时分类器,2. 广泛使用的术前评估医院临床医生常用的护理状态术后评估-发热标准。 在所有竞争产品中,申报的DyCRS在有效性、早期性和临床意义方面显著优于这些基线。······DyCRS:动态可解释术后并发症风险评分WWW1841与几乎是“黑箱”预测器的现有方法相比2问题设置我们的任务是根据术后患者的顺序和静态特征实时预测并发症风险 我们首先描述数据,然后制定任务。2.1数据集NorthShore University HealthSystem 维护一个电子数据仓库(EDW),该数据仓库捕获输入到患者电子健康记录中的信息提取了2007年1月1日至2013年12月31日期间接受择期结肠切除术的所有患者的并发症数据。功能. 我们的并发症数据包括三种类型的特征。连续的特征。在住院期间,连续并密切监测5种常见的术后生命体征,以监测术后健康状况:白细胞计数(每微升血液1000 s)、收缩压(mm Hg)、舒张压(mm Hg)、脉率(每分钟脉搏数)和体温(mmHg)。静态特征。患者根据临床医生的建议,我们在我们的模型中纳入了结肠切除术的两个信息静态特征,包括性别和单纯糖尿病共有38个静态特征可用于对比实验。时间到事件。在住院期间,某些患者的至临床恶化时间(首次发生术后并发症)可用对于临床稳定的患者,出院时间也是可用的。 我们有两个事件:临床恶化或出院。数据预处理。我们首先对五个生命体征进行预处理,使其以同步的四小时时间间隔出现。 根据临床医生的建议,我们使用每4小时间隔内生命体征的最大值,遵循常见的做法来跟踪医院并发症的发生。其次,我们使用线性插值方法来处理每个患者生命体征的缺失值,因为我们假设患者的健康状况不会突然改变。最后,我们的数据集包括526名患者,具有12,666个时间步长数据点,每个时间步长与5个生命体征相关。119例(23%)患者在手术后出现术后并发症初步分析。 在我们开始建立模型之前,我们首先做一个简单的数据分析,以证明开发实时术后评估系统的重要性。我们选择ACS NSQIP风险计算器系统使用的代表性静态特征(即,年龄),并绘制患者术后并发症发生率的直方图。在比较中,我们还选择了一个代表性的动态特征(即,事件前平均24小时术后温度),以绘制关于术后并发症率的直方图。如图3、患者的静态特征与术后并发症风险之间的相关性不显著,而实时生命信号呈现出强烈的相关性。(a)术前评估(b)术后评估图3:术前和术后评估的初步数据分析这表明术后信息与并发症之间存在强正相关性,而术前信息与并发症之间无明显相关性正相关 该比较再次验证了依赖于静态特征的传统风险评估工具可能没有足够的信息来提供术后并发症的准确预测。然而,随着术后实时生命信号的可用,其更能够反映术后患者的实际身体状况,可以对可能的并发症进行更有信息的预测,并为挽救生命的临床决策提供更有意义的支持。2.2任务制定在本节中,我们将首先描述我们的建模直觉,然后解释我们的模型基于HMM的适应性模拟直觉。如图4所示,我们随机挑选了一名临床恶化和一名出院患者,并绘制了他们的术后生命体征和事件发生时间。 手术完成后,患者将被转移到病房,进入监护期。在监测期内,连续密切地采集生命体征,以观察患者是否出现术后并发症的任何体征。因此,在此期间,患者存在发生并发症的潜在风险,但实际上事件并未发生。在某种程度上,患者临床恶化并发生并发症,患者从承受某种潜在风险转变为观察到的具有最高风险的不良事件另一方面,临床稳定的患者将在监测期间承担发生并发症的潜在风险因此,患者在监测期间,患者承担一些潜在风险,这是一个中等水平的风险(例如,低、中、高风险W.R.T并发症)。观察到的临床恶化事件是最高风险阶段,因为患者已经遇到不良事件。观察到的出院事件为无风险阶段,因为临床医生已消除风险因此,随着严重程度的增加,患者风险阶段可以总结为:无风险(观察到的出院事件)、中等风险(潜在风险阶段)、最高风险(观察到的临床恶化事件)(参见图5中建模的概念结构)。无风险和最高风险阶段····WWW王文,赵汉,庄洪磊,Nirav Shah和Rema Padman1842H()下一页H()下一页(a) 临床恶化的患者(b) 出院病人图4:两名患者的生命体征和事件发生时间的可视化观察到,而中等风险阶段是潜在的。只有观察到的生命体征才能推断出潜在的风险阶段。 因此,基本上,我们需要一个模型来捕获所有风险阶段(包括潜在和观察到的风险阶段)之间的转换关系,以及多变量生命体征和潜在风险阶段之间的关系。此外,我们的目标是为患者提供实时风险评分在我们学习了上述两种关系之后,给定新患者的生命体征,我们可以首先解码潜在风险阶段的概率分布,并使用潜在风险阶段和观察到的临床恶化事件之间的过渡关系来构建风险评分,该风险评分表示患者最终遇到恶化阶段而不是出院阶段的概率。DyCRS。隐马尔可夫模型(HMM)([34])是一种众所周知的概率图形模型,用于捕获潜在状态序列和观察到的观测序列之间的关系潜在状态将由多变量高斯分布表示以与生命体征相关联,该分布被称为发射概率。此外,与黑箱机器学习算法[ 6 ]相比,HMM的概率性质也为我们提供了更好的可解释性,这在医疗保健决策环境中非常重要。因此,在我们的情况下使用HMM是非常合适的我们结合了HMM的两个现有适应性,并提出了新的适应性,以适应我们的环境:在我们的任务中,每个患者都有两个观察状态:临床恶化事件或出院事件。因此,患者的术后演变风险阶段轨迹将被隐藏,直到其结束于临床恶化状态或出院状态。因此,我们采用适应的HMM来捕获观察到的终止状态[2]。除术后连续特征外,患者因此,我们也结合图5:所有状态(包括潜伏状态和观察状态)之间的概念关系,以及潜伏状态和生命体征之间的关系。调整后的HMM将患者静态特征纳入发射概率[32]。除了上述两个现有的适应性,我们还开发了一个管道,将隐藏状态转换为实时风险评分。给定HMM的估计参数(例如,转移概率、发射概率),对于新的患者生命体征,HMM的传统解码问题只能告诉我们最可能的隐藏状态。然而,隐藏状态是离散的(例如,低风险状态)而不是实数,因此缺乏量化并发症风险的准确性此外,显示患者处于低风险阶段也是无意义和抽象的,告诉我们患者发生并发症事件的概率的实数将更有意义和直接。3模型和算法在本节中,我们正式定义了DyCRS模型 在高层次上,我们的模型包含两个阶段:i学习阶段,学习隐藏状态和观察状态之间的转换关系,以及隐藏状态和观察(例如生命体征)之间的关系; ii随后的推理阶段,将隐藏状态转换为风险评分。3.1模型描述3.1.1状态空间。 给定三种类型的患者信息,我们构建了一个具有隐藏状态和观察状态的离散HMM,如图所示。第六章由于三个隐藏状态有一个自然的医学解释(例如,低风险、中等风险、高风险),我们在模型中选择了三个隐藏状态,但它可以很容易地推广到任何数量的隐藏状态。总之,的状态空间包含五个离散状态:出院事件(D)、对应于患者健康状况严重程度增加的三个潜在状态(低风险(L)、中等风险(M)、高风险(H))和临床恶化事件:术后并发症的发生(C)。注意,在我们的模型中,C和D都是吸收状态,它们可以被观察到,而其他三个状态(L,M和H)是瞬态和隐藏的。吸收状态是一种一旦进入就无法离开的状态。因此,我们改变了普通马尔可夫链的吸收马尔可夫链纳入观察到的终止状态。吸收马尔可夫过程将从三个瞬态之一开始,并最终进入状态C或D。 我们用S表示H中的状态集。···DyCRS:动态可解释术后并发症风险评分WWW1843H∈∈H--H≥HHS {}∈联系我们++∈:+(·|·)( |)的方式Rm×m表示模型从一个状态过渡到另一个状态的概率形式上,我们定义θT=1m+图6:DyCRS系统中使用的HMM的概率有限状态机低、中、高风险状态是代表中间风险水平的隐藏状态C代表临床恶化事件,D代表出院事件。C为最高风险状态,D为无风险状态,两者都被观察到。3.1.2观察空间。可观察的结果由患者的五个术后生命体征定义:白细胞计数(每微升血液1000s)、收缩压(mmHg)、舒张压(mmHg)、脉率(每分钟脉搏数)和体温(mmHg)。因此,每个患者o∈Rd,其中d=5。3.1.3转移概率矩阵。 对于具有m个状态的HMM H对于隐藏状态s和患者异质性向量r:p ( o |s ) = N ( Ws + Mr , σ 2Id ) ,(3)其中WRd×m是状态-观测关系的权矩阵,MRd×p是静态特征-观测矩阵它表征了患者的异质属性如何影响观察。不失一般性,我们假设上述高斯分布中的各向同性协方差矩阵,其中每个维度的方差由σ 2给出。这一假设绝不是限制性的,可以很容易地放宽。备注。注意,在我们在(3)中定义的高斯模型中,方差参数σ2是固定的先验,并且在学习过程中,我们的目标是推断权重矩阵W和M,其中s是独热向量。在这种情况下,权重矩阵W的每个列向量都有一个自然的解释:它表示由特定隐藏状态给出的观察向量3.1.5初始分配。我们在学习阶段学习的初始分布。由于D和C都是吸收态,它们对应的初始概率固定为0。对应于L、M和H的其他三个初始概率将通过EM算法来估计。3.2DyCRS学习给定一组患者,其中每个患者对应于一个观测序列,我们首先学习使生成数据的概率最大化的模型参数T、W和M定义θ:=T,W,M为模型参数集我们使用最大似然原理(MLE)将学习问题形式化为优化问题:包括隐态和观测态,转移矩阵T∈Max .nlogi=1受0TT(四)Tij :=Pr(s′=I|s = j),n∈i,j ∈ S.(一)其中,T0意味着按元素。由于隐状态的存在根据定义,很容易验证T是列随机矩阵,其中每列之和为1,即,1TT=1T。是非凸的。针对这一内在困难,我们提出了一种学习模型参数的EM算法。M m如图6,我们的HMM有5个状态,其中两个是吸收状态。 为了讨论方便,我们将状态的顺序固定为= D,L,M,H,C。在该顺序下,为了表示C和D都是吸收状态,转移矩阵T被约束为具有以下结构:T11=T55= 1,Ti1= 0,i 1,Tj5= 0,j 5。(二更)T的其余元素将从观察序列中学习,并在所有患者中共享3.1.4排放概率模型。 在本节中,我们详细描述了HMM中的连续发射概率模型,该模型同时考虑了生命体征和静态特征。 为了简化符号,在下面的推导中,当时间索引t和患者索引从上下文中清楚时,我们省略它们。设s 0,1 m是编码状态的索引的独热向量,并且r Rp是描述患者特定信息的患者静态特征向量,例如,性别、单纯性糖尿病等。我们假设观测值服从一个参数化的多元高斯分布,其均值参数是一个线性函数3.2.1学习转移概率矩阵和初始分布。为了清楚地说明学习转移概率矩阵的算法,给定一个长度为t的观测序列o,我们首先定义我们所谓的前向和后向概率。定义3.1(前向概率)。 给定一个HMM H和一个长度为t的观测序列o,j ∈ [t],我们将时间步j处的前向概率定义为αj(o)= p(sj |o1:j)∈ Rm.定义3.2(后向概率)。给定一个HMM H和一个长度为t的观测序列o,<$j ∈ [t],我们将时间步j处的后向概率定义为βj(o):= p(oj +1:t |sj)∈ Rm.对于一个特定的观察向量oRd,我们定义了可分解的算子矩阵Aow.r.t.o如下:Ao:= diag(p(o |s = 1),. . . ,p(o |s = m))·T∈ Rm×m,(5)其中概率密度函数p由(3)给出。毛皮-因此,我们还需要计算每个时间步长j处的后验置信状态,即,γj:=p sjo.有了前向和后向概率,置信状态可以很容易地计算如下:γj(o)= p(sj |o1:t)p(sj |o1:j)·p(oj +1:t |sj)= αj(o)<$βj(o),(6)p(oi|θ),T≥1844◦(())∈∀∈()下一页()下一页JJ+1τ:=ni=1 ti是所有观测值的总数,i=1i=1+1 .一、..Mk=1τFWWW其中表示Hadamard乘积,即,元素级产品类似地,我们也可以通过以下方式计算状态转换的概率:类似地,为了求解M,我们可以将优化问题重写为w.r.t. M为:.Mp(sj,sj+1|(o)联合国秘书长|o1.:j)·p(oj+1|sj+1)·p(sj+1|sj)·p(oj+2:t|sj+1)=A◦.(七)(o)α(o)βTmin||第二章,(十三)||2,(13)为了估计初始分布,我们使用所有序列的平均置信状态:M:=. .M(O−W:k1T)Γ2RT- 是的R.Γ2RTΣ−1.(十四)nπ π= nγ1(oi)。(八)τkk=1ˆKk=13i=1为了估计转移矩阵,我们对所有观察序列中所有时间步长上的所有预期状态转移计数最优解M可以在时间O(τdp+p)内计算。3.2.3整体学习算法。整个学习算法是一种迭代方法,可以理解为适合于捕获患者的静态特征和吸收状态的EMnTt.i−1p(sj,sj +1 |oi)。(九)在算法的每次迭代中,对于每个观测序列,我们首先计算前向和后向概率,i=1j= 13.2.2学习排放概率模型。为了学习排放模型中的权重矩阵W和M,我们最大化期望的对数似然函数,这可以简化为以下加权最小二乘最小化问题:我们可以获得序列中每个时间步的当前信念状态这对应于算法的E步骤,在该步骤中,我们计算给定当前模型参数的预期完整数据对数似然函数。 在M步骤中,我们应用在Sec. 3.2.1和Sec.3.2.2获取更新min.n.我不是Mγj(oi)k||2||2(十)模型参数 与传统的EM算法一样,保证每次迭代都能提高W、Mi=1j= 1k=1观察序列,并且如果STA,则算法终止。其中我们使用符号W:k来表示找到了解决方案我们总结了所提出的算法矩阵W.(10)中的目标函数在W和在算法1中。2 3M,因此优化问题是联合凸的。在这里,我们建议使用块坐标下降算法来优化上述目标函数。具体来说,在每次迭代中,我们依次找到每个列向量W:k的全局最优解,给定所有其他参数固定。然后,我们固定更新的权重矩阵W,并找到矩阵M的最优解。 要做到这一点,我们首先推导出每列的最优解。n个向量W:k,k∈[m]. 为了简化符号,我们定义算法的每次迭代时间为Oτm+dp+p。此外,由于加权最小二乘问题(10)是光滑的和凸的,算法1中的块坐标上升子过程保证在每次EM迭代中找到W和M的全局最优解因此,保证算法1中的每个EM迭代增加对数似然函数,并且保证算法收敛。3.3DyCRS推理:转换隐藏序列的构造以下对角矩阵Γk:给定从学习过程中学习到的HMMH,我们开始rk=diag.{{γj(oi)k}ti}nτ∈Rτ×τ构建动态并发症风险评分。传统并将所有列向量oij,j,i堆叠成矩阵ORd×τ。此外,对于每个ri,我们也重复ti次,并将所有这些向量堆叠成矩阵RRp×τ。利用这些新的定义,我们可以比较好地表示极小化问题w.r.t. W:k作为以下矩阵优化问题:然而,隐藏状态是离散的,而不是实数,以量化并发症风险。 此外,显示患者处于低风险阶段是无意义和抽象的,代表患者发生并发症事件的概率的实数将更有意义和直接。建立一个风险min||第二章,(十一)||2,(11)分数,我们开发了一个管道,将离散的隐藏状态转换为W:kτF为连续并发症风险评分。在高层次上,这条管道我们可以从中导出解析形式的最优解包括两个步骤:i解码步骤:给定新的患者生命体征和直到时间t的静态特征以及学习的HMM参数,ˆ: (O−MR)Γ21τ我们首先解码患者的隐藏状态分布(二)W:k =T 2K.(十二)转换步骤:然后我们转换隐藏状态分布1τrk 1τ请注意,这里我们定义巨大且稀疏的矩阵Γk只是为了数学清晰。在实际的实现中,我们将永远不会解释它。相反,将构造并使用列向量Γk21τ,其仅花费O(τ)时间和空间。使用学习到的隐藏状态和观察到的临床恶化状态之间的转换关系来调整并发症风险评分(C)。时间步t的并发症风险评分CRSto,r定义为患者在给定其观察序列o直至时间t且静态的情况下将以临床恶化状态(C)oj+1并以封闭形式求解为:并发症风险评分状态HMMM1845.()下一页(|)∞(|)(|)7:结束ll\()()()下一页C()()()()下一页H0TH LTH MTH0()下一页j=0Cj=0CDyCRS:动态可解释术后并发症风险评分WWW特征向量R。时间t的分数由下式给出:算法1DyCRS学习的期望最大化1:不收敛时CRSt(o,r):=Mk=1p(st = k |o1:t,r)× p(s∞ = C|st = k),(十五)2://E-step:3:对于i=1到n,4:使用前向算法计算αj(oi),j∈ [ti]其中p,t=k,r是解码的当前隐藏状态分布。p s=C st=k是吸收概率,即,患者将最终结束于从当前隐藏状态开始的吸收临床恶化状态C的解码步骤:给定新患者该项可以通过前向算法有效地转换步骤:我们使用吸收概率(从当前隐藏状态开始,患者最终被吸收到临床恶化状态C的概率)将隐藏状态差异进一步转换为并发症风险评分。 可以通过以下方式从估计的转移矩阵导出转移概率:在我们的模型中有2个吸收状态和3个瞬态学习的转移矩阵T具有以下标准形式:D L M HC D1TDLTDM TDH 05:使用后向算法计算βj(oi),βj∈ [ti]6:计算信念状态γj(oi)<$αj(oi)<$βj(oi),<$j∈[ti]8://M-step:9:使用(8)更新初始分布10:使用(9)更新转换矩阵11://块坐标上升:12:当W或M没有收敛时,13:对于k=1至m,14:修复所有其他列并使用(12)更新W:k15:结束16:使用(14)修复W并更新M第17章:结束第18章:结束L0TLLTLMTLH0T= M0TMLTMMTMH0.(十六)L lCZ0TCL TCMTCH1l定义pD:=TDL,TDM,TDHT和pC:=TCL,TCM,TCHT是分别包含从瞬态L、M、H到吸收状态D和C的跃迁概率的向量将T中的中间3× 3子矩阵表示为Q。则吸收概率p(s∞=C|st)可以计算如下:p(s∞=C|st)=.∞p(st+j=C|st)=pT。∞Qj=pT(I-Q)−1。与前向概率的公式相结合,最终的CRSt0,r可以被简洁地表示并有效地计算如下:图7:DyCRS实时推理流程图。4实验CRSt(o,r)= pT(I-Q)−1αt(o)。(十七)对于长度为t的序列,可以在0 tm时间内计算得分CRSto,r采用前向算法,CRSt+1o从CRStoo的更新可在O m时间内完成。分数是实时计算的,在这个意义上,当新的生命体征可用,DyCRS系统将计算新的风险评分当风险评分高于预定义阈值时,DyCRS系统将发出警报。否则,系统将等待新的观察结果,以在下一个时间步长重新评分并发症风险。我们的DyCRS系统中推理的整个系统管道如图所示。第七章4.1实验装置我们将DyCRS框架的性能与来自医学和机器学习研究社区的最先进方法进行了比较。基线包括四个类别:机器学习实时预测器。 滑动窗口方法是一种常见且广泛使用的实时预测技术[20,28,40]。我们比较了支持向量机与径向基核(SVM),正则化逻辑回归与LISO1正则化(LASSO),随机森林,AdaBoost,Bagging和梯度提升使用滑动窗口方法。具体而言,我们使用固定大小的窗口来过滤事件发生(临床恶化或出院)之前的生命体征。这些固定长度的序列WWW王文,赵汉,庄洪磊,Nirav Shah和Rema Padman1846--联系我们--将用作训练数据,以了解事件发生前患者健康状况的 对于测试集,我们逐步移动滑动窗口,并使用每个模型进行预测,这个预测得分将被用作实时并发症得分。DyCRS框架中使用的静态特性也包括在内,以便进行公平的比较。滑动窗口的大小是一个超参数,需要针对每个模型进行调整对于像AdaBoost和Bagging这样的集成方法,我们使用决策树作为集成中的每个组件我们在10,50,100中执行网格搜索,以找到用于增强方法的最佳组件数量。为了找到滑动窗口的最佳大小,我们还在{12,24,36,48}小时内对每个模型进行网格搜索4.2性能度量为了测量所有实时方法(包括拟定DyCRS系统和实时基线)的性能,我们计算了测试集中所有患者在每个时间步的风险评分每个患者都会有一个风险评分序列,每当风险评分超过阈值时,就会发现目标“处于风险”的患者,风险评分超过阈值的时间表示为Texceed,事件发生时间(临床恶化或出院)表示为Tevent。 我们在结果部分更详细地讨论了阈值的选择。准确度指标。我们首先来看看召回率和准确率。事件发生前的顺序深度学习实时预测。 我们进一步与长短期记忆(LSTM)进行比较,LSTM是一种用于建模的深度学习技术回忆=并发症患者数量(十八)时间数据[26,39]。具体来说,每个时间步的输入是一个7维向量,因为我们有5个生命体征与正确预测并发症患者数量预测并发症患者数量(十九)每个时间步长和2个静态特征。 输入将被传递到隐藏层。在隐藏层的顶部,我们使用sigmoid层将输出压缩到0到1之间的风险分数我们执行网格搜索以找到隐藏层的最佳数量(Hl)和隐藏大小(Hs)(Hl1, 2, 3,Hs20, 50, 80, 100)。亚当优化器用于优化参数。我们将批量大小设置为32,学习率设置为0。01. 我们训练LSTM 200次迭代。术前评估:最先进的ACSNSQIP手术风险计算器。ACS NSQIP是医院广泛使用的手术风险计算器在线网络系统。它利用患者的静态特征来预测术后并发症。ACS NSQIP包括两个阶段:静态特征选择和估计。与ACSNSQIP [9]原始论文中描述的特征选择过程类似,我们早期度量。然后,我们还想看看我们的实时预测可以在临床医生的决定(T事件)之前多早预测(T超过)。我们需要更早的时间,因为我们越早发现“高危”病人,就越能帮助我们采取措施,防止它造成更大的不良影响。我们要遵循[46]的定义,将早期定义为:早期=E[T超过-T事件],( 20)其中,期望值适用于所有正确预测的并发症患者。临床显著性指标。为了进一步证明DyCRS系统的临床意义,我们查看每个正确报警的错误报警数量,定义为:采用递归特征剔除法,考虑到越来越小的特征集。在选择预计为并发症患者的出院患者数量正确预测并发症患者数量(二十一)在这个过程中,估计器在原始特征集上进行训练,并且通过估计器的系数获得每个特征的重要性。从当前特征集中删除最不重要的特征选择过程是递归重复的修剪集,直到所需数量的功能选择最终实现。 对于估计量,它使用广义线性混合模型,该模型捕获医院和程序之间的随机效应。然而,我们的数据集来自一家医院,并且仅用于择期结肠切除术,因此该模型可以简化为逻辑回归。因此,我们直接使用逻辑回归作为估计量。特征的数量是一个需要调整的超参数,我们在5,10,15,20,25,30,35上执行网格搜索以找到最佳特征。术后评估:医院临床医生使用的发热标准。简单的发热标准通常被临床医生用作手术结束后潜在并发症的指标 发热标准定义为:体温> 100。华氏四度。因此,当患者我们使用5重分层交叉验证。 对于每个折叠,我们使用三个部分来训练模型,使用一个部分进行验证,其余一个部分作为测试分数报告。验证集用于ACS NSQIP模型的特征选择和所有方法的超参数调优我们报告平均测试结果。每一个正确的警报需要更少的假警报,这意味着我们有更大的信心来生成警报。4.3结果整体比较。我们使用精确率-召回率曲线下面积(AUCPRC)来扫描所有可能的阈值,以进行公平和综合水平的比较。请注意,我们使用精确度-召回率曲线而不是受试者工作特征(ROC)曲线,因为我们的数据略有不平衡。 以前的研究表明,在不平衡数据集上进行评估时,精确度-召回率曲线比ROC曲线信息量更大[36]。如 表 1 所 示 , 我 们 提 出 的 DyCRS 实 现 了 最 佳 AUCPRC(0.52),并显著优于所有其他机器学习、深度学习算法和最先进的ACS NSQIP计算器(p <0.01),平均增益为50.16%。我们还可以发现,一次性和静态ACS NSQIP计算器的效果比DyCRS和其他机器学习实时预测器差这表明仅利用患者的静态特征不能有效地发现术后并发症。相反,术后生命体征更能反映患者术后的实际身体状况,因此比静态特征更能预测术后并发症。综上所述,我们提出的DyCRS可以使用动态生命体征和静态特征进行动态检测,在检测效果方面可以是更好的选择。精度=DyCRS:动态可解释术后并发症风险评分WWW1847AUCPRC算法是说标准品(%)DyCRS0.521.55增强0.401.99AdaBoost0.422.83套袋0.362.09randomForest0.373.09Lasso0.352.15SVM0.342.69ACS NSQIP0.342.33LSTM0.251.43表1:总体性能比较。拟定DyCRS显著优于其他基线(p<0.05)。01)。对于实时预测器,我们的DyCRS比所有基于滑动窗口的机器学习实时预测器都要好。这表明使用部分而不是完整术后序列的滑动窗口方法在测量长期依赖性方面受到限制,并且只能捕获固定持续时间内患者的健康状态变化,因此可以丢弃可能提供临床恶化信息的一些有意义和代表性的临床状态,因此这些方法可能失败。对于LSTM,实验结果表明,它总是预测像随机猜测(例如,总是预测0而不是1),这可能是由于难以使用稀疏医学数据来训练深度学习模型的事实因此,我们将在下面的分析中排除LSTM。实际影响:精确度和重调用率之间的权衡。为了显示实际意义,我们进一步在图中绘制了精确率和召回率之间的权衡八、一方面,对于任何特定的召回率,DyCRS都实现了比基准方法更高的准确率。这意味着,如果我们确定要识别的并发症患者的数量,DyCRS将产生更少的假警报。例如,将召回率固定为40%,DyCRS的准确率达到60%,比最佳基线(AdaBoost)高出15.4% 这表明DyCRS在生成并发症警报时更准确,因此可以减少警报疲劳[38]。另一方面,对于任何特定的精确率,DyCRS系统可以检测到明显更多的术后并发症患者。医院临床医生使用的常见术后评估,例如,发烧的标准,并没有很好地工作(召回率为43%,准确率为32%)。对于相同的43%的召回率,我们的DyCRS实现了比它高92%的准确率。事实上,发热标准比ACS NSQIP和实时预测器都差这表明发热标准本身并不是术后并发症的良好指标早期及临床意义。如何“早”这些铝出租可以预测是另一个重要的方面来衡量。如图9、DyCRS可以比临床医生的诊断提前15小时55分钟预测,召回率为60%,DyCRS比其他实时预测器平均提前3小时56分钟。 对于50%和70%的召回率也是如此。DyCRS的早期性将为临床医生提供在患者之前采取治疗措施的机会图8:精确率和召回率之间的权衡DyCRS始终优于其他基线。图9:早期测量不同算法在临床医生决定之前可以预测的时间。GB、AB、RF代表梯度增强、AdaBoost、随机森林。图10:临床意义:每一个正确报警的假报警数量。GB、AB、RF代表梯度增强、AdaBoost、随机森林。这将潜在地减少不良事件并节省医疗保健成本。为了进一步显示DyCRS的临床意义,我们在图中显示了每一个正确警报的假警报数量10. 对于50%的召回率,DyCRS每次正确报警仅生成0.74个假报警。相比之下,大多数其他基线将生成比DyCRS多一倍的假警报这表明与其他基线相比,DyCRS对其警报更有信心,并且可能会减少警报疲劳[38]并提高医院资源利用率。可解释性:与先前的医疗术后并发症研究一致。每种的估计平均值WWW王文,赵汉,庄洪磊,Nirav Shah和Rema Padman1848lZllM00。0270. 九二零零。0260我我表2:以三种隐藏状态为条件的生命体征的估计平均值。WBC:白细胞计数; BP:血压。L、M、H:低、中、高风险状态。生命体征L M H正常范围白细胞8.37 9.30 13.024.5-11.0(10每升9个收缩压(mmHg)120.69 150.78 126.87<120 80舒张压(mm Hg)64.08 80.49 68.59<120超过80脉搏率(min−1)77.26 85.37103.02 60-100温度(华氏度)98.45 98.43 98.84 97-99以三种隐藏状态为条件的生命体征总结在表2中。 我们预计L、M、H代表风险水平的增加w.r.t. 并发症(例如,低风险、中风险、高风险)。与L相比,M的并发症风险水平更高,因为M的大多数标准高于L,这得到了既往医学研究的支持,即术后生命体征增加与术后并发症风险增加相关[25]。特别地,收缩压和舒张压超过正常范围(小于120(收缩压)超过80(舒张压))。与M相
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Fisher Iris Setosa数据的主成分分析及可视化- Matlab实现
- 深入理解JavaScript类与面向对象编程
- Argspect-0.0.1版本Python包发布与使用说明
- OpenNetAdmin v09.07.15 PHP项目源码下载
- 掌握Node.js: 构建高性能Web服务器与应用程序
- Matlab矢量绘图工具:polarG函数使用详解
- 实现Vue.js中PDF文件的签名显示功能
- 开源项目PSPSolver:资源约束调度问题求解器库
- 探索vwru系统:大众的虚拟现实招聘平台
- 深入理解cJSON:案例与源文件解析
- 多边形扩展算法在MATLAB中的应用与实现
- 用React类组件创建迷你待办事项列表指南
- Python库setuptools-58.5.3助力高效开发
- fmfiles工具:在MATLAB中查找丢失文件并列出错误
- 老枪二级域名系统PHP源码简易版发布
- 探索DOSGUI开源库:C/C++图形界面开发新篇章
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功