没有合适的资源?快使用搜索试试~ 我知道了~
ICEES环境健康数据分析:哮喘及相关疾病影响因素多变量分析
医学信息学解锁26(2021)100733临床和环境暴露综合数据的开放式多变量分析方法KaramarieFecho a,*,1,Perry Haaland b,Ashok Krishnamurthy a,c,Bo Lan d,Stephen A. 拉姆西,帕特里克湖施密特a,普里亚·夏尔马 a,梅加马拉·辛哈 e,徐浩aa美国北卡罗来纳州教堂山的北卡罗来纳大学文艺复兴计算研究所b美国北卡罗来纳州教堂山北卡罗来纳大学统计与运筹学系c美国北卡罗来纳州教堂山北卡罗来纳大学计算机科学系美国北卡罗来纳大学教堂山分校高速公路安全研究中心美国俄勒冈州立大学A R T I C L EI N FO保留字:开放科学开放临床数据广义线性模型环境健康A B S T R A C T综合临床和环境暴露服务(ICEES)提供符合法规的开放访问敏感患者数据,这些数据已与公共暴露数据集成。ICEES最初的设计是为了支持动态队列创建和双变量应急测试。本研究的目的是开发一种开放的方法来支持多变量分析,使用现有的ICEES功能,并遵守所有的监管限制。我们首先开发了一种用于生成多变量表的开放方法,该多变量表使用对开放ICEES应用程序编程接口的编程调用来维护临床变量和环境变量之间的偶然性。然后,我们将该方法应用于一个大型哮喘或相关疾病患者队列(N=22,365)由于监管限制,数据丢失与每个连续特征变量的合并有关,起始样本量为N=最终样本量为N= 4,556(20.4%),但数据丢失10%,直到添加最后两个样本<特征变量然后,我们将广义线性模型应用于随后的数据集,并重点关注七个选择的特征变量对哮喘急性发作的影响,定义为每年急诊或住院呼吸问题。我们确定了五个特征变量--性别、种族、肥胖、强的松和空气中的颗粒物浓度--作为哮喘恶化的重要预测因子。我们讨论了ICEES开放式多变量分析的优点和缺点,并得出结论,尽管存在局限性,ICEES可以为开放式多变量分析提供宝贵的资源,并可以作为开放患者数据的符合法规的信息解决方案的典范,具有探索环境暴露对健康结果的影响的能力。1. 介绍近年来,医学研究界和患者倡导团体对开放访问和共享电子健康记录(EHR)数据的兴趣一直在增长。当前的冠状病毒大流行,以及迅速启动对病毒及其对健康影响的研究,以及分享数据和发现并制定应对这一前所未有的健康危机的全球对策的必要性,可能最能突出这种努力的好处。哥伦比亚开放健康数据(COHD)[1]和重症监护医学信息集市(MIMIC)[2]正在努力减少围绕EHR数据访问的监管和制度障碍,共同目标是促进研究,同时保护患者隐私并维护制度保证。然而,需要进一步努力才能真正利用EHR数据并将数据应用于促进全球人类健康和福祉。作为由国家推进转化科学中心资助的生物医学数据翻译器(“翻译器”)计划[ 3,4 ]的一部分* 通讯作者。北卡罗来纳大学教堂山分校,RENCI,100 Europa Drive,Suite 540,Chapel Hill,NC,27517,USA。电子邮件地址:kfecho@copperlineprofessionalsolutions.com(K. Fecho)。1 作者按顺序列出。https://doi.org/10.1016/j.imu.2021.100733接收日期:2021年6月14日;接收日期:2021年8月31日;接受日期:2021年9月11日2021年9月20日网上发售2352-9148/© 2021作者。由Elsevier Ltd.发布。这是CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表医学信息学期刊主页:www.elsevier.com/locate/imuK. Fecho等人医学信息学解锁26(2021)1007332已在患者层面与各种公共暴露数据进行了整合:综合临床和环境暴露服务(ICEES)。任何人都可以通过应用程序编程接口(API)在互联网上访问ICEES。我们通过复制已发表的哮喘和相关常见肺部疾病研究结果,对ICEES进行了验证[5我们已经扩展了ICEES,以暴露CIMHealth内患者的多机构数据,这些患者也是国家环境健康科学研究所环境多态性登记处的参与者[7]。此外,作为Translator计划的一部分,我们使用ICEES进行了一项多机构研究,没有监管限制,为期五天的我们还开发了一种工具,用于可视化和探索ICEES作为互连节点的虽然ICEES已经证明了技术上的有效性和科学性,虽然这项服务在应用方面存在一些问题,但它仍然受到联邦和机构的限制,这些限制虽然是必要的,但也限制了现有的功能。 ICEES目前支持动态定义队列并探索特征变量(如诊断、药物和空气污染物暴露)之间的双变量关系的能力。在此,我们描述了一种新的开放式方法的开发,该方法使用现有的符合法规的ICEES功能来支持多变量分析,同时维护所有联邦和机构法规并保护患者隐私。我们将开放多变量方法应用于哮喘驾驶用例,使用广义线性模型(GLM)预测哮喘急性发作。最后,我们讨论了使用ICEES进行多变量分析的优点和缺点2. 材料和方法所有研究程序均由北卡罗来纳大学教堂山分校的机构审查委员会批准(方案#16- 2978)。2.1. 技术概述2.1.1. 开放多元方法ICEES配备了符合法规的分析功能,允许用户动态创建队列并生成具有相应X平方统计量、概率和频率的双变量列联表。出于开发更复杂的多变量分析功能的愿望,我们在这里描述了一种开放方法的开发和应用,该方法使用ICEES中当前可用的功能进行多变量分析。该方法利用动态群组创建功能可移植性和责任法案[12]。然后,数据通过遵循翻译应用程序编程接口(TRAPI)标准的开放ICEES API[13]公开。2.1.3. 多元ICEES集成特征表我们在驾驶应用用例的背景下开发了多变量方法,其中我们询问哮喘急性发作与以下人口统计学特征、临床特征和环境暴露之间是否存在关系:性别、种族、泼尼松处方、肥胖诊断、住宅靠近主要道路或高速公路、住宅密度和暴露于空气颗粒物。这些变量是根据已发表的研究选择的,包括我们之前的工作[6,8,9],这些研究确定了这些已知或疑似与哮喘急性发作相关的变量。我们重点关注现有的ICEES队列中患有哮喘或相关疾病的CIMHealth患者(详见参考文献[6]),我们认为每年急诊科(ED)或住院呼吸问题访视的次数是哮喘急性发作的主要结局指标和指标。我们在2010年检查了哮喘急性发作,因为这是该队列数据可用的第一年。这七个特征或自变量和主要的结果度量或因变量定义并列举在表1中。虽然ICEES支持检查呼吸问题的ED/住院患者访视与每个感兴趣的特征变量之间的双变量关系的功能,但它不直接支持应用多变量统计或机器学习模型来检查多个特征变量之间的关系和相互作用。为了应用多变量模型,需要一个八特征表,每行代表一个个体患者,每列标题代表一个不同的特征变量,并在特征变量之间保持偶然性为了实现这一点,我们应用了ICEES动态队列创建功能,并使用嵌套的二元偶然事件来生成必要的多元特征表。该方法的视觉概览见图1。具体来说,我们首先选择哮喘队列,表类型(患者或访问)、表格版本和感兴趣的日历年作为输入参数。 我们 然后 创建 单独 队列 为 每个 水平 的表1用于生成多元表的特征变量。特征变量变量定义和枚举ED住院患者访视总数“研究”期间因呼吸问题进行的ED或住院患者访视总数(0,1,以这种方式来维护特征偶然性并生成多变量表,同时保持符合所有联邦和机构法规。Sex2种族(第二、三、男性(M,0),女性(F,1)高加索人,非洲裔美国人,亚洲人,夏威夷原住民/太平洋岛民,美国人/阿拉斯加原住民,其他2.1.2. ICEES综合特征表泼尼松一个或多个泼尼松处方超过ICEES设计的关键是我们称之为“ICEES集成功能表”。表格设计为一年的“研究期”,其中每行代表一名患者,每列标题代表一个特征变量。这些表格包含来自患者EHR的临床数据元素的综合数据和来自各种公共来源的暴露数据(例如,美国环境保护局空气中颗粒物暴露、美国交通运输部道路暴露、美国人口普查局美国社区调查社会经济暴露、北卡罗来纳州环境质量部集中动物养殖作业暴露和垃圾填埋场暴露)。集成步骤使用复杂的定制软件管道[8]来实现,并且需要受保护的健康信息(PHI;即,地理编码和日期)。因此,这一步骤是根据必须由机构审查委员会批准的方案进行的。但是,在集成之后,所有PHI元素都将被删除肥胖DX MaxDailyPM2.5EX肥胖_StudyMax公路距离E. X阳性2EstResidentialDensity’study一个或多个肥胖症诊断代码超过’study美国环境保护署估计的空气中颗粒物每日最大暴露量≤2。5-μm直径(PM2.5)在“研究”期间,使用熊猫分箱。切割(1,2,3,(第4、5段)美国交通部从住户到最近道路的距离(以米为单位)(1= 0-49,2= 50-99,3= 100-149,4= 150-199,5=200-249,6= ≥250 m)美国人口普查局2007 - 2011年美国社区调查集群[2500,50000),3=城市化地区[50000,inf))根据健康保险§164.514(b)的数据缩略语:PM 2.5=直径≤2.5μm的颗粒物。K. Fecho等人医学信息学解锁26(2021)1007333====≤≤=Fig. 1. 通过应用动态队列创建和嵌套双变量意外事件生成ICEES多变量表的过程的高级概述。 每个变量的水平或箱在OpenAPI提供的源文档中定义,也可以作为ICEES OpenAPI端点访问。本研究中使用的特征变量定义和枚举见表1因变量(即,ED/因呼吸问题住院访视COHORT:哮喘队列中0例患者,0例患者因呼吸系统问题COHORT:哮喘队列中1例患者因呼吸问题COHORT:哮喘队列中2例患者因呼吸问题队列:哮喘队列中的N例患者,因呼吸问题COHORT:N的边界由基础数据(即,在任何给定年份中,患者报告的年度ED/住院患者就诊的最大次数)以及对ICEES服务施加的监管限制,即,不能创建具有10名患者的队列,在这种情况下,服务返回错误消息,指示数据不存在或所选队列由10名患者组成。对于这里描述的工作,这种监管约束的实际含义是,在生成多变量表的过程中的每一步都会发生。我们通过比较每个队列总和的大小或每个中间表的行数与总样本的大小来量化数据丢失。创建多变量表的下一步是为第一步中生成的每个队列创建双变量列联表。在我们的示例用例中,我们使用了Sex2 x Race。由于保持了特征变量之间的偶然性,因此我们能够创建一个三元表,其中行被转换为表示N1例患者(图2)的情况。下一步是为三个特征变量的每种组合创建队列。队列:100=哮喘队列中因呼吸问题每年ED/患者访视0次的患者+男性+非洲裔美国人队列:101=哮喘队列中因呼吸问题每年ED/患者访视1次的患者+男性+非洲裔美国人队列:102=哮喘队列中因呼吸问题每年ED/患者访视2次的患者+男性+非洲裔美国人图二. 示例ICEES三变量表,汇总形式的行表示共享每列中定义的特征的患者数量。因此,每行可以被复制以表示N=1个患者。K. Fecho等人医学信息学解锁26(2021)1007334≥ ≤ ≤队列:N=哮喘队列中因呼吸问题接受N次年度ED/住院访视的患者+X性别+X人种对于每个新队列,生成第二个双变量列联表。在我们的示例中,关联是泼尼松x肥胖Dx。然后针对MaxDailyPM2.5Exposure_StudyMaxx Road-wayDistanceExposure 2重复队列创建和双变量列联表步骤。由于我们对奇数个独立变量感兴趣,我们应用于数据的最后一步是调用 ICEES 单 变 量 功 能 ( 也 称 为 功 能 丰 富 的 队 列 发 现 ) 来 检 查EstResidentialDensity的频率。完成这一步后,我们就能够生成一个八特征多变量表,每行代表一个个体患者(见结果)。出于解释目的 ,并 为 了最 大限 度 地减 少数 据丢 失 ,我 们 将因 变量 TotalEDInpatientVisits分类为0,1,2.1.4. 多元广义线性模型我们开发了一种GLM算法,使用R来预测总ED患者访问(即,结果或因变量)使用在ICEES多变量表中提取的七个独立特征变量。变量TotalED InpatientVisits表示一年研究期内的访视计数,并且计数的分布过度分散,或如预期的那样向右倾斜(即,很少有患者在任何一年内因呼吸问题频繁地到急诊室就诊或住院)。为了解释过度分散,我们将负二项模型拟合到数据[15]。用质量概率函数表示的负二项分布的理论方程为:3. 结果3.1. 八特征多元表和估计的数据损失我们应用ICEES开放式多变量方法生成了一个八特征多变量表,旨在支持我们的驾驶应用用例,即选择人口统计变量、社会经济暴露和空气污染物暴露对哮喘加重的影响(图1)。3)。然后,我们通过比较每个重新创建的队列与初始队列的大小来量化过程中每个步骤发生的数据丢失(表2)。在纳入第四个独立变量后发生数据丢失,并在纳入第七个和最后一个独立变量后增加至57.1%。3.2. 应用用例结果我们将GLM算法应用于得到的多变量表,并询问以下特定用例问题:性别、种族、泼尼松处方、肥胖诊断、住宅区靠近主要道路或高速公路、住宅密度和/或暴露于空气颗粒物是否可独立或通过相互作用预测哮喘急性发作?我们发现人种、泼尼松、ObesityDx、MaxDailyPM2.5Exposure_StudyMax和性别2具有显著的主效应(表3)。一些双向和三向相互作用也很重要。在双向相互作用中,泼尼松与Sex2、ObesityDx、MaxDailyPM2.5Exposure_StudyMax和RoadwayDistance Exposure2显示出显著的相互作用。Sex2XObesityDx的显著效应也很明显。PΓ(x+r)rx在三因素相互作用中(数据未显示),肥胖DxX性别2X(X = x|r,p)= x!Γ(r)p(1-p),人种、肥胖DxX性别2X泼尼松和肥胖DxX人种X泼尼松意义重大 更高层次的相互作用并不显著。其中负二项分布是在独立试验中第r次成功之前失败次数X的分布,每次试验的成功概率为p(因此,r0和0p 1)。为了确保负二项模型准确拟合数据并解释过度分散,我们使用R中的DHARMa包正式测试了过度分散及其显著性,用于分层(多级/混合)回归模型的残差不可知性[16]。该软件包应用基于模拟的方法为广义线性混合模型(包括负二项GLM)创建易于解释的标度(分位数)残差。DHARMa模型显示,偏离度与自由度为0.89(离散度参数),P值为2.2e-16,<这表明负二项模型将充分解决过度分散问题。因为某些变量的频率(例如,道路距离EX posure 2)在各个区间的分布并不均匀,因此我们采用了合成少数过采样技术(SMOTE)[17]来解释数据中的不平衡。SMOTE方法增加了少数类,以便平衡数据,使得模型性能考虑具有其他低频率的单元。在采用SMOTE方法之前,我们考虑了其他几种估计技术来解决数据不平衡问题,包括随机抽样。有两种主要的方法来执行随机抽样,我们考虑了这两种方法:(i)过抽样,或从少数类中复制样本;(ii)欠抽样,或从多数类中删除样本。由于随机抽样引入了偏差,并且被认为是天真的,没有关于数据的假设[18],我们选择了SMOTE方法。满意我们的方法,我们应用GLM检查两个主要的影响和双向和三向相互作用。然后,我们将方差分析(ANOVA)应用于获得的GLM结果。我们将α设为0.05。4. 讨论我们展示了以编程方式使用现有符合法规的ICEES功能(即,动态群组创建和双变量偶然性)以生成多变量集成特征表。重要的是,我们开发了一个GLM模型,并将其应用于所得的多变量表,并确定了五个特征变量-泼尼松、种族、肥胖Dx、性别2、最大每日PM2.5暴露_StudyMax-作为总ED住院访视的显著预测因素。重要的是,我们的应用结果与已发表的文献一致。例如,泼尼松通常用于治疗对一线治疗(如吸入沙丁胺醇)无反应的患者的急性哮喘加重[19]。女性、肥胖和非裔美国人种族先前已被确定为导致哮喘急性发作的变量。例如,Greenblatt等人[20]发现女性性别和肥胖(以及其他变量)显著增加了哮喘急性发作的几率。我们之前的研究[8]和其他人的研究[21]发现,非裔美国人种族与哮喘加重风险增加之间存在显著相关性。最后,暴露于空气中的颗粒物是哮喘和哮喘急性发作的一个公认的危险因素。为例如,Requia等人[22]的一项研究发现,加拿大117个地区的PM2.5两年增加10微克/立方米和哮喘发病率增加的风险。Mirabelli等人[23]同样发现暴露于PM2.5和哮喘风险之间存在显著关联。我们还证明了暴露于高水平的PM2.5和哮喘急性发作之间的关联[6]。主要道路或高速公路的暴露量通常被用作空气中颗粒物暴露的指标。事实上,几个研究小组已经证明,居住在主要道路或高速公路附近的患者中哮喘急性发作增加[24,25]。我们没有将主要道路/高速公路暴露作为哮喘发作的重要预测因素。由于我们的患者人群主要是农村(未发表的观察结果),我们推测暴露于主要道路或K. Fecho等人医学信息学解锁26(2021)1007335=≤=-===图三. 来自ICEES八特征多变量表的EXcerpt。频率列允许用户生成患者级别的行,例如,为第二行中定义的特征创建六个单独的行,并为每行分配一个伪标识符表2用ICEES开放多变量方法量化数据丢失一添加的特征变量bICEES总计(N)最大可能的最小值(N)缺失样本(N)缺失的平均值/最大可能平均值(%)起始样本量22365N/AN/AN/A性别2223652236500种族223652236500泼尼松223652236500肥胖DX22208223611530.68MaxDailyPM2.5EX 1000_StudyMax158611739015298.79道路距离EX posure 250228262324039.2EstResidentialDensity455610615605957.1a筛 选 “ 研 究 ” 期 间 ( 2 0 1 0 日 历 年 ) 活 跃 患 者 前 的 起始样本量:N163302.B 特征变量是按照所列的顺序添加的,遵循图1所示的模式。1.一、高速公路可能与哮喘恶化无关虽然我们已经验证了这里描述的ICEES开放多变量方法,但有几个考虑因素值得讨论。首先,ICEES多变量表必须在驱动用例问题的上下文中创建,并将因变量标识和定义为整个方法的起点。虽然这本身不是一个限制,但这是用户应该考虑的问题其次,虽然ICEES多元分析方法是公开的,但ICEES服务本身受到监管约束,限制了可以访问的数据量和可以执行的分析类型。具体而言,无法创建队列10例患者。该限制的影响是,每当创建少于或等于10名患者的队列时,都会发生一定量的数据丢失。我们正在开发一个理论框架来估计数据丢失与变量的不同组合。例如,假设最有利的情况,即每个特征只有两个值,并且患者在可能的值之间平均分配。假设查询中有k个特征。然后,最终的队列,比如C(k- 1),必须至少有10个受试者被包括在查询输出中的倒数第二队列,例如C(k-2),必须具有>4*10个患者作为最小值。因此,根队列,比如C(1),必须至少有>(4^(k-2))*10个患者。如果有八个特征,|C(1)|>(4^6)*至少需要10 4096*10 40,960名患者,以确保在上述最简单、最有利的假设下没有数据丢失。我们计划开发一种技术方法,将此信息呈现给用户,以便他们能够以知情的方式应用多元方法。第三,与上述考虑相关,变量的选择和顺序影响开放多变量方法和最终样本量。例如,一个变量有许多缺失值或多个水平,根据定义,将减少最终的样本量。在一些情况下的这种限制影响可能相当大。例如,ICEES目前公开了关于基因组变异的数据,但这些数据仅可用于一小部分患者,因此将来自ICEES的基因组特征并入多变量分析是不现实的。第四,ICEES开放多变量方法中固有的数据丢失可能会影响模型质量。考虑到最后一张桌子有 每一行对应所选特征的每一个组合。对于查询中任何先前队列小于或等于10的表中任何行,无论其真值如何,返回的频率都将返回为零,但我们知道真值不能大于10. 如果低频行随机分布在选定的特征中,那么我们可以假设查询过程可能会降低模型结果的精度,但不会引入偏差。相反,如果低频行不是随机分布在所选特征中,那么我们可能会在模型中引入偏差,这将系统地影响模型结果的准确性,并可能导致虚假的结论。我们正在探索预测和减少偏差的方法。尽管存在局限性,但我们相信ICEES开放多元方法提供了一种独特的、符合法规的服务,具有广泛的应用。我们现在将GLM模型的鲁棒性和结果与API输出和底层数据进行比较。我们还在开发其他多变量模型,如随机森林和因果推理。最后,我们正在扩展服务以支持其他用例,主要包括纤毛运动障碍和其他罕见呼吸系统疾病,药物性肝损伤,冠状病毒感染和罕见疾病表型。资金支持该项目得到了国家中心的资助,K. Fecho等人医学信息学解锁26(2021)1007336一表3具有主效应和双向交互作用的GLM模型的ANOVA结果一道路距离EX posure 2缩略语:ANOVA =方差分析; df =自由度; GLM =广义线性模型; Sig =显著性水平(*:0.05,**:0.01,*0.001)。负二项模型,链接:log,因变量:总ED住院访视。为了便于阅读,表中未包括三向和更高的交互推进转化科学,国立卫生研究院[OT3TR002020,OT2TR003430,OT2TR003428,UL1TR002489,UL 1 TR 002489 - 03 S4]和美国国立卫生研究院国家环境健康科学研究所校内研究项目临床研究分部[ZID ES 103354 -01]。竞合利益作者声明,他们没有已知的可能影响本文所报告工作致谢作者感谢David Peden博士和Shepherd Schurman博士提供的用例专业知识,以及Schurman博士和他在国家环境健康科学研究所的同事在单独的工作中贡献了ICEES用例。作者还感谢他们在生物医学数据翻译联盟中的同事对本文所述工作的智力投入和支持。引用[1] [10]李文辉,李文辉,李文辉.哥伦比亚开放健康数据的临床概念流行率和共同出现从电子健康记录。Sci Data2018;5:180273.[2] Johnson AEW,Pollard TJ,Shen L,et al. MIMIC-III,a freely accessible criticalcaredatabase. Sci Data2016;3:160035.[3] 生物医学数据翻译联盟。生物医学数据翻译程序:概念,文化和社区。 临床转化科学2019;12(2):86-90。[4] 生物医学数据翻译联盟。一个通用的生物医学数据翻译器。临床转化科学2019;12(2):91-4。[5] 2005年10月26日,李文辉,李文辉. NCATS生物医学数据翻译器财团临床数据:来源和类型,监管限制,应用。临床转化科学2019;12(4):329-33。10.1111/cts.12638 * 作者按顺序列出; K. Fecho担任主要作者。[6] Fecho K,Pfaff E,Xu H,ChampionJ, CoX S,Stillwell L,Bizon C,PedenD,Krishnamurthy A,Tropsha A,Ahalt SC.一种公开和共享临床数据的新方法:Translator Integrated Clinical and Environmental EXposures Service。美国医学信息杂志2019;26(10):1064-73。https://doi.org/10.1093/jamia/ocz042.[7] Pfaff ER,ChampionJ, Bradford RL,Clark M,Xu H,Fecho K,Krishnamurthy A,CoX S,Chute CG,Overby Taylor C,Ahalt S.快速医疗保健互操作性资源(FHIR)作为Meta模型集成通用数据模型:开发工具和定量验证研究。JMIR Med Inform 2019;7(4):e15199。https://doi.org/10.2196/15199网站。[8] 徐H,CoX S,Stillwell L,Pfaff E,ChampionJ, Ahalt SC,Fecho K. FHIR PIT:用于临床数据和环境暴露数据时空整合的开放式软件应用程序。20.第20章. 网址://doi. org/10.21203/rs.2.19633/v1。第53条.[9] [10] Fecho K*,Garantziotis S,Krishnamurthy A,Pfaff E,Schmitt C,SchurmanS,Shuptrine S,Xu H,Ahalt S.使用ICEES对多机构数据进行开放式综合分析。同行评审海报,AMIA 2021虚拟信息学峰会。* 除了第一/主要和最后/资深作者外,所有作者均按顺序列出。[10] Fecho K,* Arunachalum S,ChampionJ, Chute CG,Gersing K,GlusmanG,HadlockJ, LeeJ, Pfaff E,Robinson M,Sid E,Ta C,Xu H,Zhu R,Zhu Q.Peden DB和生物医学数据翻译联盟。性别、肥胖、糖尿病和颗粒物暴露:通过分析开放临床数据源揭示的科学见解。JBiomed Inf 2019;100:103325。https://doi.org/10.1016/j.jbi.2019.103325[SpecialCommunication],* 除第一/主要和最后/资深作者外,所有其他作者均按字母顺序列出。[11] [10]李文,李文,李文.TranQL:联合知识图的交互式查询和可视化环境。JMIR Med Inform 2020;8(11):e17964。网址://doi.org/10.2196/17964。[12] 健 康 保 险 便 携 性 和 责 任 法 案 , HIPAA , https://www.hhs.gov/hipaa/for-professionals/privacy/special-topics/de-identification/index.html。[13] ICEES和相关资源。ICEES OpenAPI:https://icees.renci.org:16340/api docs/。ICEES GitHub存储库:https://github.com/NCATS-Tangerine/icees-api/tree/master/; CAMP FHIR GitHub存储库:https://github.com/NCTraCSIDSci/camp-fhir; FHIR PIT GitHub存储库:https://GITHUB.COM/Xu-hao/FHIR-PIT。[14] 翻译器应用程序编程接口(TRAPI)。https://github.com/NCATSTranslator/ReasonerAPI/issues.主要影响或相互作用DF越轨残差df剩余偏差P值SigNULL149368796.1性别2116.701149358779.44.376e-05***种族5141.052149308638.3<2.2e-16***泼尼松1153.832149298484.5<2.2e-16***肥胖DX128.412149288456.19.806e-08***MaxDailyPM2_5EX 100_StudyMax236.204149268419.91.375e-08***道路距离EX posure 259.601149218410.30.087363EstResidentialDensity10.2741492084100.600541性别2:种族59.395149158400.60.094305性别2:泼尼松10.871149148399.70.35066性别2:肥胖DX16.249149198403.40.012426*Sex2:MaxDailyPM2_5EX X_StudyMax20.4281490683630.80749性别2:道路距离EX posure 252.997148968347.60.700431性别2:EstResidentialDensity12.814148558314.80.093454人种:泼尼松218.555149128381.29.351e-05***种族:肥胖DX21.35149098373.50.509129比赛:MaxDailyPM2_5EX E1000_StudyMax31.589149038361.40.661954比赛:公路距离EX posure 2259.651487183380.997493种族:EstResidentialDensity51.129148508313.70.951543泼尼松:肥胖DX110.07149088363.50.001507**Prednisone:MaxDailyPM2_5EX泼尼松_StudyMax19.507149028351.90.002047泼尼松:公路距离EX剂量2514.696148668323.30.011744泼尼松:EstResidentialDensity10.175148498313.50.676105ObesityDX:MaxDailyPM2_5EX X X_StudyMax11.313149018350.60.251903肥胖DX:道路距离EX posure 252148618321.30.849104ObesityDX:EstResidentialDensity10.658148488312.80.417263MaxDailyPM2_5EX XP_StudyMax:53.681148568317.60.596173MaxDailyPM2_5EX XP_StudyMax:10.115148478312.70.734287EstResidentialDensity道路距离EX posure 250.862148428311.80.972891EstResidentialDensityK. Fecho等人医学信息学解锁26(2021)1007337=[15] Lehman RR,Archer KJ.惩罚负二项模型对高维预测空间的过度分散计数结果建模:应用于预测微核频率。PloS One 2019;14(1):e0209923。网址://doi.org/10.1371/journal.pone.0209923。[16] 哈蒂格湾DHARMa:分层(多级/混合)回归模型的残差诊断。R包版本0.4.3。2021年7月7日https://CRAN.R-project的网站。org/package DHARMa.[17] BrownleeJ. SMOTE使用Python进行不平衡分类。1月机器学习掌握2020;17。更新于2021年1月5日,https://machinelearningmastery.com/smote-oversampling-for-imbalanced-classification/。[18] Ferna'ndezA,GarcíaS,GalarM,PratiRC,KrawczykB,HerreraF. 从不平衡的数据中学习。瑞士AG:Springer Nature; 2018。https://doi.org/10.1007/978-3-319-98074-4.[19] 阿兰加里AA.糖皮质激素治疗急性哮喘。胸外科医学年鉴2014;9(4):187-92。[20] Greenblatt RE,Zhao EJ,Henrickson SE,Apter AJ,Hubbard RA,Himes BE.根据电子健康记录数据,成人哮喘患者急性加重的相关因素。哮喘研究实践2019;5:1。https://doi.org/10.1186/s40733-019-0048-7. eCollection 2019,https://www.ncbi.nlm.nih.gov/pubmed/30680222。[21] Keet CA,McCormack MC,Pollack CE,Peng RD,McGowan E,Matsui EC.邻里贫困,城市居住,种族/民族,和哮喘:重新思考市中心哮喘的流行。过敏临床免疫学杂志2015;135(4):655-62。https://doi.org/10.1016/j.jaci.2014.11.022。[22] Requia WJ,Adams MD,Koutrakis P.加拿大PM 2.5与糖尿病,哮喘和高血压发病率的关联:能源生产和燃料销售影响的时空分析。科学总环境2017;584:1077-83。 585[23] Mirabelli MC,Vaidyanathan A,Flanders WD,Qin X,Garbe P.活动性哮喘成人中过去14天的室外PM 2.5,环境空气温度和哮喘症状。环境健康展望2016;124(12):1882-90。网址://doi. org/10.1289/EHP92。[24] [10]张文辉,张文辉.近道污染与儿童哮喘:发展“双赢”紧凑型城市发展和清洁车辆战略的意义。环境健康展望2012年11月;120(11):1619-26。https://doi.org/10.1289/ehp.1104785。Epub 2012 Sep. 24岁[25] Schurman SH,Bravo MA,Innes CL,Jackson WB,McGrath JA,Miranda ML,et al. Toll样受体4途径多态性与污染相互作用以影响哮喘诊断和严重程度。SciRep 2018:12713. https://doi.org/10.1038/s41598-018-30865-0.
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- SSM动力电池数据管理系统源码及数据库详解
- R语言桑基图绘制与SCI图输入文件代码分析
- Linux下Sakagari Hurricane翻译工作:cpktools的使用教程
- prettybench: 让 Go 基准测试结果更易读
- Python官方文档查询库,提升开发效率与时间节约
- 基于Django的Python就业系统毕设源码
- 高并发下的SpringBoot与Nginx+Redis会话共享解决方案
- 构建问答游戏:Node.js与Express.js实战教程
- MATLAB在旅行商问题中的应用与优化方法研究
- OMAPL138 DSP平台UPP接口编程实践
- 杰克逊维尔非营利地基工程的VMS项目介绍
- 宠物猫企业网站模板PHP源码下载
- 52简易计算器源码解析与下载指南
- 探索Node.js v6.2.1 - 事件驱动的高性能Web服务器环境
- 找回WinSCP密码的神器:winscppasswd工具介绍
- xctools:解析Xcode命令行工具输出的Ruby库
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功