没有合适的资源?快使用搜索试试~ 我知道了~
文章全球生物库荟萃分析中的全蛋白质组孟德尔随机化揭示了常见疾病的多祖先图形摘要亮点d多祖先蛋白质组范围的孟德尔随机化(MR)分析管道d确定欧洲和非洲祖先D 确定特定祖先的因果效应d优先考虑新的药物靶点和药物再利用机会作者Huiling Zhao,Humaria Rasheed,Therese Haugdahl Nøst,.,Benjamin M.作者:Tom R.冈特,郑洁通信wzhou@broadinstitute.org(W.Z.),bneale@broadinstitute.org(B.M.N.),tom. bristol.ac.uk(T.R.G.),jie.bristol.ac.uk(J.Z.)简言之我们提出了一个来自全球生物库荟萃分析倡议(GBMI)的多祖先蛋白质组范围的MR管道,以确定具有多祖先因果证据和祖先特异性效应的蛋白质-疾病对。通过将MR信号与观察和临床试验证据相结合,我们评估了现有药物的疗效并确定了药物再利用的机会。Zhao等人,2022,细胞基因组学2,1001952022年11月9日-作者。https://doi.org/10.1016/j.xgen.2022.100195会会开放获取文章全球生物库荟萃分析中的全蛋白质组孟德尔随机化显示常见病Huiling Zhao,1Humaria Rasheed,1,2,3Therese Haugdahl Nøst,2,4Yoonsu Cho,1Yi Liu,1LaxmiBhatta,2Arjun Bhattacharya,5,6Global Biobank Meta-analysis Initiative,Gibran Hemani,1GeorgeDavey Smith,1,7Ben Michael Brumpton,3,8,9,15Wei Zhou,10,11,12,15,*Benjamin M.Neale,11,12,15,*Tom R.冈特,1,7,15,*和郑洁1,13,14,15,16,*1MRC综合流行病学单位(IEU),布里斯托尔大学布里斯托尔医学院,Oakfield House,Oakfield Grove,Bristol BS8 2BN,UK2 K.G.捷成遗传流行病学中心,挪威3挪威奥斯陆奥斯陆大学医学与实验室科学系4Department of Community Medicine,UIT The Arctic University of Norway,9037 Tromswestern,Norway5美国加州大学洛杉矶分校David Geffen医学院病理学和实验室医学系6美国加州大学洛杉矶分校David Geffen医学院定量和计算生物科学研究所7NIHR布里斯托尔生物医学研究中心,布里斯托尔,英国8HUNT研究中心,公共卫生和护理系,NTNU,挪威科技大学,7600 Levanger,挪威9挪威特隆赫姆特隆赫姆大学医院圣奥拉夫斯医院医学诊所10内科,心血管内科,密歇根大学,Ann Arbor,MI 48109,USA11分析和转化遗传学单位,马萨诸塞州总医院,波士顿,MA 02114,美国12Stanley Center for Psychiatric Research,Broad Institute of Harvard and MIT,Cambridge,MA 02142,USA13上海市瑞金医院内分泌代谢病研究所内分泌代谢病科中国上海同济大学医学院14上海国家代谢疾病临床研究中心、国家内分泌代谢疾病重点实验室中国卫生健康委员会,上海市内分泌肿瘤重点实验室,医学基因组学国家重点实验室,上海交通大学医学院附属瑞金医院,上海,中国15、作者贡献相等16引线触点* 通信:wzhou@broadinstitute.org(W.Z.),bneale@broadinstitute.org(B.M.N.),tom. bristol.ac.uk(T.R.G.),jie.bristol.ac.uk(J.Z.)https://doi.org/10.1016/j.xgen.2022.100195总结全蛋白质组孟德尔随机化(MR)在欧洲人中显示出优先药物靶点的价值,但在其他祖先中的证据在这里,我们提出了一个多祖先的蛋白质组的MR分析的基础上跨人群的数据从全球生物银行荟萃分析倡议(GBMI)。我们估计了1,545种蛋白质对非洲(32,658)和欧洲(1,219,993)祖先中8种疾病的假定因果效应,并在两个祖先中分别鉴定了45种和7种具有MR和遗传共定位证据的蛋白质-疾病对多祖先MR比较确定了两个蛋白质-疾病对,在两个祖先中都有MR证据,七对分别在两个祖先中有特定影响将这些MR信号与临床试验证据相结合,我们优先考虑了16对用于未来药物试验的研究。我们的研究结果强调了蛋白质组范围的MR在告知疾病预防药物靶点在祖先中的普遍性方面的价值,并说明了生物库的荟萃分析在药物开发中的价值。介绍在III期临床试验期间,通常在一个或少数人群中评价药物的疗效利用多祖先数据进行药物发现有几个明显的好处。首先,祖先特异性数据可能导致新的药物靶点的开发。例如,PCSK 9中的功能缺失突变首先是使用来自非洲人的测序数据确定的努力过2其次,遗传工具提供了一种经济有效的方法来了解药物靶点在不同祖先之间是否具有相似或不同的效果,这有助于提高药物干预在不同祖先之间的普遍性。一种可能的方法是使用影响药物靶点的遗传变异3,4全蛋白质组孟德尔随机化(MR)利用蛋白质水平的遗传预测因子来测试推定的CellGenomics 2,100195,November 9,2022 <$2022作者。1这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。会开放获取文章2细胞基因组学2,100195,2022蛋白质对常见疾病的因果作用。根据关键假设,MR可以提供证据证明数千种蛋白质对多种疾病风险的假定因果作用。5-6除了这些研究,MR还可以在不同祖先的药物靶点优先排序方面发挥关键作用,10这可能会为未来试验的设计提供信息。11由于了解不同祖先之间疾病病因学差异的重要性,多祖先研究正变得越来越重要。其他人已经开发并应用了遗传相关的跨祖先方法,12多基因风险评分,13,14和精细定位15,16分析。然而,使用MR的多祖先假定因果推理仍处于起步阶段。17限制多血统MR发展的一个主要问题是不同种族群体的全基因组关联研究(GWAS)样本的代表性不平衡,有一篇评论报告称,在已发表的GWAS中,78%的参与者具有欧洲血统。因此,大多数已发表的蛋白质组GWAS和MR研究仅限于欧洲血统。5-最近的血浆蛋白质组GWAS已经在欧洲和非洲祖先中鉴定了pQTL21本研究使用先前描述的全转录组关联研究管道进一步估计了欧洲人血浆尿酸盐和痛风蛋白的关联。22在全球生物库荟萃分析倡议(GBMI)中,这种独特的多祖先pQTL资源与祖先富集的GWAS资源的整合为多祖先蛋白质组MR分析提供了理想的机会。GBMI已整理了260万受试者的多祖先遗传数据集,包括来自亚洲、非洲、西班牙裔美国人和欧洲祖先的样本;已标准化表型/疾病定义;并在这些生物库中应用了通用GWAS分析管道23这一举措使我们能够使用协调良好的GWAS数据进行多祖先蛋白质组MR。在这项研究中,我们系统地估计了1,311和1,310种蛋白质的假定因果作用,分别在非洲和欧洲血统的人群中测量(两个血统中有1,076种蛋白质),使用基于我们先前在欧洲数据集中的方法的具有追溯性的血统特异性MR管道对8种复杂疾病进行了评估6我们进一步估计了各祖先间pQTL的一致性,确定了潜在的多祖先和祖先特异性的预防疾病发作的推定致病蛋白,并将MR发现与观察和临床试验证据24相结合,以优先考虑药物靶点。我们 在 一 个 可 公 开 访 问 的 数 据 库 中 报 告 了 我 们 的 结 果 :EpiGraphDB1(https://epigraphdb.org/multi-ancestry-pwmr/)。结果蛋白质和疾病数据的选择和验证总结选择蛋白质编码基因500 kb内的顺式作用pQTL作为蛋白质组MR分析的遗传工具,因为顺式作用pQTL比反式作用pQTL更可能具有蛋白质特异性效应。5对于详细MR分析,6,144个条件独立pQTL选择来自社区动脉粥样硬化风险研究(ARIC)研究21的7,213名欧洲人的1,310种蛋白质的3,875个条件独立pQTL(表S1)和1,871名非洲人的1,311种蛋白质的3,875个条件独立pQTL(表S2我们将条件非依赖性pQTLs定义为一组对测试蛋白质具有独立遗传效应的顺式作用pQTLs。使用QTLtools软件包(https://qtltools. github.io/qtltools/),然后是精细映射方法SuSiE。25为了提高可靠性和提高功效,我们开发了一个三步仪器验证管道来过滤最适合MR假设的pQTL。首先,为了避免MR模型的潜在共线性问题,我们应用连锁年龄不平衡(LD)聚类来去除彼此强相关的pQTL(r20.6)。第二,我们估计使用F-统计量的仪器强度,从MR分析中排除F-统计量低于10的pQTL,以避免潜在的弱仪器偏倚。26第三,我们应用MR Steiger过滤方法27来排除具有潜在反向因果关系的pQTL28(即,其中疾病的遗传易感性对蛋白质具有推定的因果作用)。经过筛选,共筛选出非洲人1,311个蛋白质的3,550个pQTL和欧洲人1,310个蛋白质的5,418个pQTL作为MR分析的仪器(图1)。我们使用我们先前开发的精细仪器验证过程6将pQTL进一步分为三层(详情见图S1和S2、表S3和STAR方法)。我们保留了用于MR分析的所有仪器,但使用这些等级注释了我们的结果,并建议谨慎处理异质性和非特异性仪器的结果。为了验证MR分析,从Zheng et al.6(表S4)和来自非裔美国人肾病和高血压队列研究(AASK)队列的467名非洲人中的290种蛋白质的290个条件非依赖性pQTL(表S5)被选择作为验证MR分析的工具(图1)。对于MR分析的结果,我们从GBMI中选择了14种疾病中的8种,这是基于我们在欧洲和非洲血统中具有完整的GWAS汇总统计数据和相对良好的统计功效(超过100例)。8种疾病结局包括特发性肺纤维化(IPF)、原发性开角型青光眼(POAG)、心力衰竭(HF)、静脉血栓栓塞(VTE)、卒中、痛风、慢性阻塞性肺病(COPD)和哮喘(表S6A和S6 B)。细胞基因组学2,100195,2022年11月9日3会开放获取文章图1.全球生物库荟萃分析计划中多祖先全蛋白质组孟德尔随机化(MR)的研究设计蛋白质对非洲和欧洲祖先疾病的假定因果效应的估计我们进行了两个阶段(发现和验证)的MR和敏感性分析,以系统地评估1,311种血浆蛋白对非洲血统中8种疾病的推定因果作用的证据,并分别评估1,310种蛋白的证据在欧洲祖先身上发现的八种疾病值得注意的是,由于我们在此使用的结果数据来自病例对照GWAS,因此本研究中鉴定的蛋白质-疾病对是疾病预防而非治疗的潜在靶点。在这些蛋白质中,有1,076种在两个祖先中都有工具(表S1和S2)。其中544个(20.8%)只有一个pQTL,599个(22.9%)有两个pQTL,1,478个(56.4%)有三个或三个以上pQTL。对于蛋白质,一个pQTL,我们应用Wald比率检验。29对于具有两个或多个pQTL 的 蛋 白 质 , 我 们 应 用 了 广 义 逆 方 差 加 权 法 ( IVW;gIVW),30该方法考虑了附近cis仪器之间的LD相关性,并增加了MR分析的可靠性(因为条件独立的pQTL可能仍然处于LD中,常规IVW可能使这些信号之间的效应加倍)。对于具有三个或更多个pQTL的蛋白质,我们进一步应用广义MR-Egger回归(gEgger)方法,30,31这允许我们估计多效性对MR估计的潜在影响。当疾病GWAS数据中缺失某个pQTL时,我们使用具有该pQTL的高LD中的替代遗传变体(在相关群体32的1000个基因组数据中r2> 0.8)(图1)。4细胞基因组学2,100195,2022会开放获取文章Discovery MR和敏感性分析我们对欧洲血统中的10,318对蛋白质-疾病对和非洲血统中的9,858对进行了发现MR。其中,欧洲血统的69个MR信号和非洲血统的1个信号达到了0.05的Benjamini-Hochberg错误发现率(FDR)。为了最大限度地提高识别真实假定因果效应的可能性,我们对通过FDR阈值的MR信号进行了一系列敏感性分析,其中包括使用gEgger截距项的多效性检验31、使用Cochran's Q进行gIVW分析和使用R u cker's Q进行gEgger分析的异质性检验6,35gEgger截距检验表明,欧洲人中69种潜在蛋白质疾病效应中的10种(14.5%)和非洲人中无一种效应显示受定向多效性影响的证据(表S9A)。由于多效性使MR的排除限制假设无效,因此将这10个结果从候选推定因果效应列表中排除因此,在发现分析中,总共59个欧洲血统的MR信号和1个非洲血统的信号被认为是候选蛋白质-疾病对(表S7A和S8A)。对于欧洲血统的其余59对蛋白质-疾病对和非洲血统的1对,我们能够对其中53对进行异质性检验。38例(71.7%)显示几乎没有异质性(表S7A和S8A)。这一观察结果意味着相同蛋白质的条件非依赖性顺式pQTL倾向于对相关疾病结果显示成比例的相似效应由于异质性可能由各种因素引起,11我们在候选列表中保留了具有异质性证据的MR信号,但在我们的结果中对此进行了注释。为了进一步区分假定的致病蛋白-疾病对与LD混淆,我们应用了三种共定位方法:常规共定位、35PWCoCo和LD检查分析。6LD检查分析估计了顺式区域中每个pQTL和疾病相关GWAS信号之间的LD,表明欧洲血统中的43个蛋白质-疾病对和非洲血统中的一个蛋白质-疾病对显示出近似共定位的证据(成对LD r2> 0.7;表S7 A和S8A)。这包括ABO的蛋白水平,其显示了有力的MR和LD检查对VTE的证据,在欧洲和非洲血统中具有相同的影响方向(欧洲人的比值比[OR]= 1.11,p = 5.593 10-11,LDr2 = 1;非洲人的OR = 1.33,p = 2.823 10- 6; LD r2 = 0.80;表S7S8)。常规共定位和PWCoCo显示在欧洲和非洲祖先中分别有18个和1个蛋白质-疾病对的共定位证据(共定位后概率>70%)。例如,我们在之前的蛋白质组范围MR研究中使用PROCR区域中的反式作用变体鉴定了PROC的蛋白质水平对VTE的影响,6使用GBMI VTE GWAS数据使用相同变体证实了这一点。36在这项研究中,我们使用顺式作用pQTL(p = 1.45310- 8,共定位概率= 99%)估计了欧洲血统中PROC水平对VTE的相同影响,但在非洲血统中的证据较弱(p = 8.963 10- 3,共定位概率= 11%)。总之,欧洲和/或非洲血统的60个MR信号中有46个(76.7%)显示共定位和/或LD检查证据(表S7A和S8A)。最后,我们考虑了由靶序列内的蛋白质改变变体驱动的潜在适体结合伪影。在欧洲和非洲血统中选择的5,418个和3,550个pQTL中,使用Ensembl变体效应预测器(VEP)37(表S1和S2)将1,421个(15.8%)pQTL或其LD代理(在1000个基因组参考组中r2对于使用这些pQTL作为遗传工具的MR在59个稳健的欧洲MR信号和1个稳健的African MR信号中,26个(43.3%)使用非编码变体(并且LD替代也是非编码变体)作为欧洲和/或非洲血统的工具进行估计(表S7和S8),因此不太可能受到适体结合伪影的影响。如表1所总结,欧洲血统中的45个MR信号和非洲血统中的1个信号超过FDR校正阈值,并显示共定位/LD检查证据和轻微的多效性证据。使用来自独立样品的pQTL数据验证MR信号我们选择了通过FDR阈值0.05的59个欧洲MR信号和1个非洲信号进行验证MR分析(表S7A和S8A)。从两个非重叠研究中选择条件独立pQTL作为工具,Zhenget al.6、问。21在仪器选择和验证之后,我们能够分别在欧洲和非洲血统的28对和1对中进行验证MR在这些对中,14个蛋白质-疾病对和1个蛋白质-疾病对分别在欧洲和非洲血统中显示MR证据(在验证分析中FDR0.05)(表S10 A和S10 B)。当数据可用时,我们对验证MR信号应用相同的灵敏度分析,包括共定位分析。6对显示出欧洲血统的共定位证据(表S10A和S10B)。性别特异先生药物的治疗反应往往因性别而异。38为了研究性别特异性遗传效应对我们的蛋白质组MR信号的潜在影响,我们使用GBMI提供的仅男性和女性疾病GWAS进行了性别特异性蛋白质组MR(表S6)。在蛋白质-疾病对中,欧洲血统的7,498对蛋白质-疾病对和非洲血统的7,693对蛋白质-疾病对具有可用于在女性和男性中进行MR分析的数据。应用比较仅男性和女性MR估计值的成对Z评分检验来鉴定具有性别特异性效应的蛋白质-疾病对。对欧洲和非洲血统的成对Z评分p值应用FDR阈值0.05后,欧洲血统的12对蛋白质-疾病对和非洲血统的3对蛋白质-疾病对显示出性别间MR估计值差异的稳健证据(表S11)。在这些蛋白质-疾病对中,其中3个与现有药物靶点的蛋白质相关,包括哮喘的白细胞介素-17受体拮抗剂(IL-17 RA)水平、IPF的内质网氨肽酶1(ERAP 1)水平(托塞司他的靶点)和HF的NQO 1水平(伐替醌的靶点)(图2)。蛋白质IL-17 RA是药物brodalumab的靶点,细胞基因组学2,100195,2022年11月9日5会开放获取文章表1.与STAR方法相关的欧洲和非洲血统的全蛋白质组MR结果总结病例/对照FDR 0.05的MR信号,共定位证据对疾病欧洲血统非洲血统欧洲血统非洲血统特发性肺纤维化(IPF)4,066/751,962168/8,36430原发性开角型青光眼11,657/957,371483/26,32330心力衰竭(HF)27,064/796,602970/16,82300静脉血栓栓塞(VTE)15,907/696,3951,031/16,743171中风15,520/852,4321,161/24,41120痛风20,512/843,5071,313/33,89640慢性阻塞性肺疾病(COPD)51,231/800,5771,978/27,69920哮喘100,736/1,219,2155,054/2,7599140总MR结果451FDR,错误发现率; MR,孟德尔随机化。在 421 名 参 与 者 的 2 期 试 验 ( brodalumab 对 比 安 慰 剂 ;ClinicalTrials.gov:NCT 01902290)中测试了该药物对哮喘的功效然而,试验因缺乏疗效而终止。我们的MR结果显示,在欧洲血统的男性中,遗传增加的IL-17 RA水平与哮喘风险增加相关(OR = 1.03; 95%置信区间[CI] = 1.02-尽管在性别联合试验中IL-17 RA抑制对哮喘的保护作用相对较小(ClinicalTrials.gov:NCT 01902290),但我们的研究表明,该靶点对男性哮喘的疗效可能值得在未来的试验中重新考虑pQTL和蛋白质组MR信号的多祖先比较pQTLs的祖先特异性的系统评价pQTLs可能由于不同的等位基因频率、LD结构、样本大小或相互作用而在祖先间显示不同的效应。我们使用TAMR软件包(https://github.com/universe77/TAMR)系统地评估了pQTL的祖先特异性。TAMR允许我们估计跨两个祖先的pQTL与预期相比具有显著不同的作用方向或不同水平的统计证据的频率,其中预期的复制程度使用先前研究中描述的贝叶斯赢家诅咒校正来计算。39使用期望度复制作为基准提供了pQTL的比较,考虑了等位基因频率、样本大小和pQTL在祖先间的效应大小在两个试验中具有完整概括统计和pQTL信号的1,076个蛋白质被包括在该分析中。我们首先估计了非洲pQTL与欧洲pQTL相比显示祖先特异性/一致性的频率在预期的pQTLs中,73.0%的pQTLs在两个亲本间的作用方向一致在两个祖先中观察到83.6%的预期pQTL达到GWAS全基因组证据阈值(p53 10- 8)(表S12A)。相反,我们估计了欧洲pQTL与非洲pQTL相比显示祖先特异性/一致性的频率与非洲pQTL的结果一致,我们发现71.8%的预期pQTL在两个祖先中显示出一致的作用方向然而,在两个祖先中,只有60.8%的预期pQTL满足GWAS全基因 组 证 据 阈 值 , 这 主 要 是 由 统 计 功 效 差 异 驱 动 的 ( 表S12B)。识别的多祖先和祖先特异性pQTLpQTL工具的遗传学特异性可能是蛋白质对疾病的估计的祖先特异性推定因果效应的差异的直接原因。因此,有必要在我们的pQTL工具中区分跨祖先和祖先特异性pQTL。我们对1,310名和1,311名受试者进行了分层多祖先和特定祖先病例/对照脑特异性MR信号FDR 0.05MR结果欧洲血统非洲血统欧洲血统非洲血统特发性肺纤维化(IPF)4,066/751,962168/8,36440原发性开角型青光眼11,657/957,371483/26,32391心力衰竭(HF)27,064/796,602970/16,82371静脉血栓栓塞(VTE)15,907/696,3951,031/16,743181中风15,520/852,4321,161/24,41143痛风20,512/843,5071,313/33,89692慢性阻塞性肺疾病(COPD)51,231/800,5771,978/27,699102哮喘100,736/1,219,2155,054/2,7599282总MR结果89126细胞基因组学2,100195,2022会开放获取文章图2.蛋白质组MR信号在男性和女性中表现出明显的影响列出了每个蛋白质-疾病对的性别合并和性别特异性MR估计值基于跨越祖先的pQTL信号,将蛋白质分成四种可能的情况(图3A):(1)基因组区域内的蛋白质,其在两个祖先中具有pQTL信号,但其信号在祖先中不共享;(2)基因组区域内的蛋白质,其在祖先中具有一个或多个共享的pQTL(并且没有非共享的pQTL);(3)基因组区域内的蛋白质,其具有共享和非共享的pQTL;和(4)区域内的蛋白质,其仅在一个祖先中具有pQTL。如图3B和3C所示,在测试的蛋白质中,它们中的1,076个在两个株系中都位于具有pQTL的区域其余的包括在具有欧洲特异性pQTL的区域内的234种蛋白质和在具有非洲特异性pQTL的区域内的235种蛋白质(情况4;表S13 A和S13 B)。对于具有多个pQTL信号的区域内的1,076个蛋白质,974个在相关区域中具有共享的pQTL(情况 2或3;图 3C;表S14)。其余102个蛋白质在这些区域中仅具有非共享的pQTL(情况1;图3C;表S15 A和S15 B)。多祖先和祖先特异性MR信号我们对59个独特的蛋白质-疾病对进行了多血统比较,这些蛋白质-疾病对在至少一个血统中显示出稳健的MR证据(FDR0.05)(其中ABO对VTE的影响出现在两个血统中;表S7A和S8A)。使用基于59个蛋白质-疾病对的0.05的FDR阈值,我们鉴定了7个在两个祖先中都具有MR信号的对(图4A;表S16 A)。比较这7种蛋白质-疾病对的MR效应估计值,我们观察到各血统间的MR效应估计值具有非常高的相关性(Pearson相关性= 85.8%;表1;图4B)。在应用了一个明确的祖先特异性比较后,我们确定了7个欧洲特异性和7个非洲特异性的MR信号,两个信号在两个祖先中都显示出稳健的MR证据(图4C和4D)。更详细地,我们首先考虑来自发现MR的共定位证据(图5A),其中两个蛋白质-疾病对在两个祖先中都显示出共定位证据。这些包括与VTE相关的SERPINE 2的遗传预测蛋白水平(欧洲人OR = 0.94,95%CI = 0.92-进一步比较两种蛋白质-疾病对与验证MR信号,它们均显示MR证据(验证中FDR0.05),在发现和验证分析中具有相同的影响方向(表S16A)。我们进一步鉴定了仅在一个祖先中显示MR信号的对于AfricanMR结果,我们选择了在发现MR中显示边缘MR信号(p 0.05)和共定位证据的86个蛋白质-疾病对作为候选(表S8A和S8B),并基于86个对应用FDR阈值0.05过滤后,14对通过FDR阈值。14对中有2对与多祖先MR列表重叠,并从非洲特异性信号列表中排除。在剩余的12对中(表1和S16B),其中7对在非洲验证MR中显示边缘MR信号和LD检查证据,包括SERPINF 1蛋白水平对卒中、血管紧张素转换酶(ACE)水平对COPD、B4GALT 6水平对POAG、F7水平对卒中、LY 75水平对哮喘、同种异体移植物炎症因子1(AIF 1)水平对HF和CD 248水平对痛风的遗传预测效应(表S16B)。对于欧洲MR结果,我们选择了341个具有边缘MR证据(p0.05)的蛋白质疾病对,细胞基因组学2,100195,2022年11月9日7会开放获取文章图3.鉴定共享蛋白质区域或共享pQTL的多祖先调查(A) 鉴定多祖先和祖先特异性蛋白质区域的四种情况:(1)仅在祖先之间具有非共享pQTL的蛋白质区域,(2)在祖先之间具有一个或多个共享pQTL(并且没有非共享pQTL)的蛋白质区域,(3)具有共享和非共享pQTL的蛋白质区域,以及(4)仅在一个祖先中具有pQTL的蛋白质区域。(B) 具有祖先特异性pQTL的蛋白质区域的数量。(C) 在顺式区域中具有共享pQTL的蛋白质区域的数目。在发现分析中共定位证据作为候选日期。在基于341对通过FDR阈值0.05过滤后,剩余95对(表1和S16C)。其中6例与多祖先MR列表重叠,并从欧洲特定信号列表中排除。基于验证MR证据进一步过滤剩余89个信号,其中7个在欧洲验证分析中显示MR和LD检查证据,包括F11水平对VTE的影响、KLKB 1水平对VTE的影响、ERAP 1水平对POAG的影响、肿瘤坏死因子超家族成员12(TNFSF 12)水平对哮喘的影响、细胞外基质蛋白1(ECM 1)水平对IPF的影响、CD 109水平对VTE的影响和IL-7R水平对哮喘的影响(表S16C)。使用MR、观察性和临床试验证据确定药物靶点优先级来自遗传学、观察性研究和临床试验的证据的三角分析有可能增加可靠性一种假定的因果推理。选择在发现和验证中具有MR和共定位证据的16个蛋白质-疾病对作为该分析的候选物(图4C)。我们对来自Trøndelag健康研究(HUNT)41的多达3,172名参与者进行了观察性分析(详情见STAR方法)。蛋白质的逻辑回归结果表明,16个观察关联中有9个与MR信号的作用方向相同。在这项分析中,16个观察性关联中有3个通过FDR 0.05,其中包括ACE水平COPD时的AIF 1水平、HF时的AIF 1水平和卒中时的SERPINF 1水平(表S17)。我们使用OpenTargets42和DrugBank43数据库进一步挖掘了16种优先蛋白质-疾病对的临床试验证据。如表2所总结,我们发现临床试验证据(4期试验与安慰剂; Clinical-Trials.gov:NCT01014338)支持我们的COPD患者ACE蛋白水平的MR信号,其中证据来自欧洲人。我们的研究验证了ACE抑制剂在非洲血统中降低COPD的疗效(非洲人OR = 0.88,95% CI = 0.81-加-我们还观察到七种蛋白质是现有药物的药物靶标,其中我们的MR信号表明这些药物靶标对其他适应症的潜在药物再利用机会(表2)。例如,KLKB 1蛋白是艾卡拉肽的靶点,艾卡拉肽用于治疗遗传性血管性水肿。我们的研究显示了强有力的遗传学证据,支持抑制KLKB 1蛋白水平对降低VTE风险的假定因果作用(OR = 0.78; p = 4.593 10- 15),这意味着8细胞基因组学2,100195,2022会开放获取文章图4.欧洲和非洲多祖先蛋白质组MR信号的比较(A) 多血统比较中FDR 0.05的蛋白质-疾病配对(B) 7种蛋白质-疾病对的MR效应估计值与MR证据的比较(多血统分析中FDR 0.05);每个点指一种蛋白质-疾病对,x轴指欧洲血统中的MR估计值,y轴指非洲血统中的MR估计值。(C) 欧洲和非洲血统中蛋白质-疾病推定因果关系估计值的迈阿密图;每个点是指蛋白质-疾病对,x轴是蛋白质的染色体和位置,y轴是欧洲(上图)和非洲血统(下图)中MR估计值的-log 10(p);带颜色的点是指具有多血统、非洲特异性或欧洲特异性MR效应(多血统分析中FDR 0.05)的7、12和89个蛋白质-疾病对;不同颜色是指蛋白质-疾病对的不同结果;带图例的点是在发现和验证分析中显示MR和共定位证据的2、7和7个蛋白质-疾病对(D) 多祖先比较和验证分析中具有MR(FDR 0.05)和共定位证据的蛋白质-疾病配对艾卡拉肽预防静脉血栓栓塞的再利用机会。此外,在最近的遗传学研究中也观察到ABO水平对VTE的影响,包括GBMI联盟进行的VTE GWAS荟萃分析。44我们鉴定的其余7种蛋白质-疾病对被认为是新的推定致病蛋白,因此是潜在的新药物靶标(表S18)。例如,丝氨酸蛋白酶抑制剂相关蛋白SERPINE2先前已被报道与COPD相关。45我们的MR结果证实了这种关联(MR p= 9.283 10- 5)。我们的疾病范围扫描进一步表明了其对VTE(p= 7.33 10- 8)和IPF(p =7.3 3 10 - 8)的影响。9.91310-3)。这意味着SERPINE2可以被认为是预防COPD、IPF和血栓栓塞的有吸引力的药物靶点(图S3)。为了优先考虑本研究中最有价值的药物靶点,我们总结了我们进行的药物靶点优先级分析,其中包括四个过滤步骤:发现MR,敏感性分析和验证MR,多祖先比较和三角测量。如图6A所示,筛选后,8个蛋白质-疾病对被列为最有价值的发现,包括哮喘的IL-7 R和TNFSF 12水平; COPD的ACE水平; HF的AIF 1水平;中风的SERPINF 1水平;以及中风的SERPINE 2、F11、KLKB 1和ABO水平。VTE(图6B;表S18)。其中一些配对显示出强有力的MR证据,例如,SERPINE 2和ABO与VTE相关。其中一些对显示出综合性证据,例如,ACE对COPD的影响得到了遗传、观察和临床试验证据的验证。为了定义新颖性,我们进一步将8个优先的蛋白质疾病对与现有的pQTL GWAS和10个蛋白质组研究中报告的MR结果进行了比较。5-其中有5对在以往的pQTL研究中被报道,但尚未进入临床研究,我们建议将其作为新的药物靶点。在任何pQTL研究中均未报告ACE对COPD的作用,但正在进行4期试验;因此,我们认为这是一种现有药物/靶点与在非洲血统中验证的潜力(图6B;表S18)。我们的研究提供了证据,支持在未来的临床试验中对这些蛋白质-疾病对进行正式研究。值得注意的是,我们的药物靶点优先级主要基于MR的p值阈值的使用表2.与STAR方法相关的药物靶标验证和再利用机会蛋白质疾病MR信息DrugBank信息OpenTargets信息蛋白基因结果DrugBankID药物名称分子作用当前临床适应症总体得分基因数本研究证据合成血管紧张素-Ace慢性阻塞性DB00492蒙诺抑制剂慢性高血压0.401.64310-3有效性验证转换酶肺疾病阻塞性肺非洲血统疾病凝血因子VIIF7中风DB00036凝血抑制剂血友病A和B002.42310-3再利用因子VIIa重组人类同种异体移植物炎性因子1AIF1心力衰竭DB03147黄素腺嘌呤二核苷酸未知维生素B2缺乏0.0302.67310-3再利用凝血因子XiF11静脉DB00100凝血配体血友病B,0.490.796.14310-61再利用血栓栓塞因子Xi遗传性血管水肿激肽释放酶B1KLKB1静脉DB05311ecallantide抑制剂遗传性0.050.084.59310-15再利用血栓栓塞血管水肿ER氨肽酶1Erap1主要开放-DB11781托塞多司他抑制剂急性髓性009.19310-14再利用角型青光眼白血病,胰腺癌,和多骨髓瘤肿瘤坏死TNFSF 12 哮喘N/ABIIB-023*抑制剂狼疮性肾炎0.0101.50三一零七再利用因子(TNF)超家族构件12白细胞介素-7受体IL7R哮喘DB08895tofacitinib抑制剂类风湿和0.50.793.71310-3再利用银屑病关节炎会开放获取文章Cell Genomics2,100195,November 9,20229会开放获取文章10细胞基因组学2,100195,2022图5.两种蛋白质-疾病对与MR的区域基因组图以及欧洲和非洲祖先中潜在因果关系的共定位证据(A) 这两个理论模型涉及遗传共定位、因果关系、共定位以及LD混杂(B) 欧洲和非洲血统中VTE的SERPINE 2蛋白水平的区域图(C) 欧洲和非洲血统中VTE的ABO蛋白水平区域图。证据(基于gIVW估计的FDR 0.05),我们仅将其用作启发式,以突出值得随访的假定因果效应。因此,通过过滤从我们的网络浏览器(https://epigraphdb.org/multi-ancestry-pwmr/)下载的蛋白质-疾病效应,结果的调查可以应用更严格(或更不严格)的阈值。讨论应用GWAS研究复杂性状和疾病已有15年以上的历史。随着越来越多的人参与到GBMI等主要联盟中,我们现在正在进入一个跨生物库对GWAS进行多祖先荟萃分析的新时代会开放获取文章细胞基因组学2,100195,2022年11月9日11图6.跨欧洲和非洲血统的MR信号的药物靶点优先化特征(A) 本研究的药物靶点优先化概况。(B) 8个优先药物靶点的证据水平(详情见表S17和S18)。会开放获取文章12细胞基因组学2,100195,2022提供了新的机遇和挑战。在这项研究中,我们利用来自GBMI的多祖先GWAS数据在两个祖先中实施蛋白质组范围的MR通过估计蛋白质在欧洲和非洲祖先中预防相关疾病的21,470个假定因果效应,我们分别在两个祖先中的45个和7个蛋白质-疾病对中发现了潜在因果效应的证据,具有MR和共定位证据。在正式比较各祖先的MR估计值后,两个蛋白质-疾病对显示出两个祖先共有的推定因果效应,七个显示出欧洲特异性推定因果效应,七个显示出非洲特异性效应。所有上述比较结果在多祖先分析和验证分析中都显示了MR和共定位证据。通过对这16个假定的因果MR信号与临床试验和观察证据进行三角分析,我们验证了ACE抑制对COPD的疗效,并将其效果推广到非洲血统,提出了7个药物再利用机会,并确定了7个新的蛋白质-疾病对,这些对需要进一步研究,例如SERPINE 2对VTE的影响。总的来说,我们强调了多祖先MR作为一种方法的价值,该方法使用来自GBMI的GWAS结果来告知药物靶向疗效在不同祖先中的普遍性药物靶点在人群中的普遍性的一个主要问题是,大多数临床试验是在欧洲血统中进行的,并且是在药物作用在不同血统中一致的假设下进行的,但情况并非总是如此。50我们已经证明,多祖先蛋白质组MR通过使我们能够估计药物靶点在不同人群中的效果,提供了解决这种偏倚的可能性,这可能是支持多祖先临床试验设计的有用证据在这项研究中,我们确定了两种蛋白质-疾病对的多祖先假定因果效应,尽管受到统计功效的限制。这突出了在不同人群中进行大规模遗传研究的重要性,这应该是研究界的一个关键优先事项。除了在祖先中概括靶点外,我们的MR方法还确定了14种蛋白质-疾病对的祖先之间药物反应的潜在异质性的证据。例如,SERPINF 1的蛋白质水平显示支持对非洲血统中风的推定因果作用的MR证据(p = 3.76× 10- 5),但几乎没有显示对欧洲血统中风的作用的证据(p = 0.83)(参见表S1
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 多功能HTML网站模板:手机电脑适配与前端源码
- echarts实战:构建多组与堆叠条形图可视化模板
- openEuler 22.03 LTS专用openssh rpm包安装指南
- H992响应式前端网页模板源码包
- Golang标准库深度解析与实践方案
- C语言版本gRPC框架支持多语言开发教程
- H397响应式前端网站模板源码下载
- 资产配置方案:优化资源与风险管理的关键计划
- PHP宾馆管理系统(毕设)完整项目源码下载
- 中小企业电子发票应用与管理解决方案
- 多设备自适应网页源码模板下载
- 移动端H5模板源码,自适应响应式网页设计
- 探索轻量级可定制软件框架及其Http服务器特性
- Python网站爬虫代码资源压缩包
- iOS App唯一标识符获取方案的策略与实施
- 百度地图SDK2.7开发的找厕所应用源代码分享
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功