没有合适的资源?快使用搜索试试~ 我知道了~
医学信息学解锁21(2020)100443通过人群和组织SARS-CoV-2宿主基因的表达变异陈亮a,*,郑思卡b,**a定量和计算生物学,南加州大学生物科学系,1050 Childs Way,Los Angeles,CA,90089,美国bDivision of Biomedical Sciences,School of Medicine,University of California Riverside,900 University Ave,Riverside,CA,92521,United StatesA R T I C L EI N FO保留字:COVID-19E表达变异遗传变异宿主基因SARS-CoV-2转录组A B S T R A C T2019冠状病毒病(COVID-19)的一个紧迫问题是对SARS- CoV-2感染和症状严重程度的易感性的人群差异。我们探索SARS-CoV-2宿主基因的表达谱,其群体变异,相关的遗传变异,年龄和性别依赖性在正常个体。SARS-CoV-2宿主基因被暂时定义为实验验证或生物信息学预测与SARS-CoV-2蛋白相互作用的人类基因。表现出最可变表达的基因包括ACE 2、CLEC 4G、CLEC 4 M、CD 209(与SARS-CoV-2刺突蛋白相互作用); REEP 6(在嗅上皮中表达的受体辅助蛋白); SLC 27 A2和PKP 2(抑制病毒复制);以及PTGS 2(介导发热反应)。与SARS严重程度相关的SNP rs4804803影响CLEC4G和CD209的表达。与SARS-CoV-2进入相关的蛋白酶(TMPRSS 2,CTSB和CTSL)的遗传 最重要的年龄依赖性基因是ACE 2,SARS-CoV-2的细胞受体。别人包括TGF-β家族成员GDF 15,介导炎症,和VKORC 1,可能解释维生素KCOVID-19的缺陷。TIMM10和ERGIC 1具有显著的性别差异。总之,我们的研究结果表明,遗传和多种生物学变量可能是SARS-CoV-2感染和症状严重程度的群体差异的基础。1. 介绍由SARS-CoV-2感染引起的2019冠状病毒病(COVID-19)大流行疫情已影响全球超过3200万人,平均病死率为3. 0%(https://coronavirus.jhu.edu/map.html,截至2020年9月疾病表现为广谱攻击多个组织器官[1除了呼吸道症状(例如,咳嗽和肺炎),一些COVID-19患者出现胃肠道(GI)症状(例如,食欲不振、恶心、呕吐、腹泻和腹痛)和/或神经症状(例如,嗅觉和味觉丧失,肌肉无力手脚刺痛或麻木、头晕、意识模糊、谵妄、癫痫发作和中风)。症状的严重程度在患者之间差异很大。我们还不知道为什么或如何SARS-CoV-2感染导致这种情况广泛的成果。大部分SARS-CoV-2感染检测呈阳性的人无症状[6即使是有症状的患者,报告的疾病范围从非常轻微的感冒样严重的疾病和死亡[6,9]。传闻证据表明,并非所有接触SARS-CoV-2的人都被感染。虽然这些变异的来源无疑是多因素的,但一种可能性在于宿主细胞的遗传变异和可变基因表达。了解正常人群中个体对感染的内在易感性、对病毒感染的反应和疾病进展的变异原因至关重要。了解组织对SARS-CoV-2病毒攻击的可变脆弱性的机制也至关重要。了解这些变量-这不仅有助于制定有效的预防和治疗战略,而且还可以为流行病学和经济政策提供信息。可以更好地开发医学测试,以适应监测病毒传播和疾病病理学的这些变化,这有助于指导缓解和治疗方案。迄今为止,FDA尚未批准针对COVID-19的有效治疗方法,尽管有五种治疗方法被授权用于紧急用途,590多个药物开发项目正在规划阶段* 通讯作者。** 通讯作者。电子邮件地址:liang. usc.edu(L.Chen),sikaz@ucr.edu(S. Zheng)。https://doi.org/10.1016/j.imu.2020.100443接收日期:2020年7月23日;接收日期:2020年9月28日;接受日期:2020年2020年10月12日在线提供2352-9148/©2020的 自行发表通过Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表医学信息学期刊主页:http://www.elsevier.com/locate/imuL. Chen和S. 郑医学信息学解锁21(2020)1004432(https://www.fda.gov/drugs/coronavirus-covid-19-drugs/coronavirus-treatment-acceleration-program-ctap,截至2020年9月25日)。对COVID-19肺病的低剂量放射治疗进行了检查,可能值得在临床环境中进行研究[10]。在疫情爆发期间,迫切需要确定可能的候选药物,因为疫苗可能需要一年多的时间才能开发出来。 有效的药物可以干扰SARS-CoV-2的生命周期。由于病毒劫持宿主分子用于融合、复制、包装和释放,因此病毒宿主基因的靶向扰动将是减缓和/或停止病毒感染和疾病发展的合理策略。在这项研究中,我们研究了已知的和预测的SARS-CoV-2人类宿主基因在正常组织中的表达谱,人口宿主基因包括那些在人类细胞中与SARS-CoV-2蛋白相互作用的基因[11]https://www.proteinatlas.org/humanproteome/sars-cov-2和其他基于与SARS同源性预测的相互作用基因[12]http://korkinlab.org/wuhan。Gordon等人在人类细胞中克隆并表达了29种SARS-CoV-2蛋白中的26种。通过亲和纯化质谱法鉴定了与SARS-CoV-2蛋白中的每一种蛋白物理相关的人类蛋白。他们鉴定了332种人类细胞蛋白,并暂时将这些蛋白命名为SARS-CoV-2宿主蛋白。Srinivasan等人应用了一种基于结构基因组学和相互作用组学的综合生物信息学方法来鉴定SARS-CoV-2宿主蛋白。尽管这些相互作用对病毒活性的作用还需要验证,Fig. 1. SARS-CoV-2宿主基因在不同正常组织中的表达谱(A)跨组织宿主基因表达的热图。我们获得了通过GTEX RNA-seq定量的每个样品中每个基因的表达水平。然后,我们计算了同一组织的多个样品的平均表达水平。热图中的颜色暖度表示表达水平,如色标中所示。对基因(列)和组织(行)进行基于平均链接年龄的层次聚类.(B)基于宿主基因表达谱的组织t-SNE可视化(For对本图中颜色图例的解释,读者可参考本文的网络版。)L. Chen和S. 郑医学信息学解锁21(2020)1004433≥为理解病毒-宿主相互作用提供了一个合理的起点。在这里,我们暂时将所有这些蛋白质称为SARS-CoV-2宿主蛋白。我们推断SARS-CoV-2宿主基因的个体表达差异可能导致宿主对SARS-CoV-2的反应的变异性,从而导致从无症状到死亡的广泛结果。SARS-CoV-2宿主基因的组织表达变异性也可能是为了了解SARS-CoV-2宿主基因的群体和组织表达变异,我们全面分析了基因型-组织表达(GTEX)项目[13]https://gtexportal.org/中的大规模组织转录组数据。GTEX旨在表征遗传对不同个体间基因表达变异的影响(>900)和多种健康组织(>50)。它提供来自相同个体的多个组织的基因型数据和转录组数据。我们检测了该群体中的宿主基因表达变异,并鉴定了相关的遗传变异。我们推导了与肺相关的组织相似性,以了解基于SARS-CoV-2宿主基因表达的组织脆弱性。本研究结果将有助于了解个体对SARS-CoV-2易感性的差异2. 结果2.1. SARS-CoV-2宿主基因在正常人群中的组织表达在本文中,我们研究了SARS-CoV-2宿主基因在正常人群中的组织表达,使用来自非患病组织部位的转录组学数据,由GTEX提供。无偏聚类将所有分析的组织分成三组(图1A)。全血是独立的,与其他组织不同。大脑、心脏、肌肉、肝脏和胰腺属于一个簇。龙和其他人属于第三类。基于SARS-CoV-2宿主基因表达的t-SNE可视化显示了相似的组织分组(图11)。 1 B)。为了进一步了解SARS-CoV-2感染组织间的差异,我们鉴定了组织特异性基因,其在该组织中的表达与所有其他组织相比显示出至少2倍的变化。也就是说,独特组织在所有组织中表现出最大(或最小)表达,与第二大(或最小)表达的差异为1(log2标度)。总之,我们发现41个宿主基因表现出组织特异性高表达和37个组织特异性低表达(表S1)。肺中宿主基因的高表达可能是肺对SARS-CoV-2的易感性。SFTPD在肺中特别高表达(图2)。它参与先天免疫反应,并保护肺部免受吸入的微生物和化学物质的侵害[14]。图二、SARS-CoV-2重 要 宿主基因的表达谱L. Chen和S. 郑医学信息学解锁21(2020)1004434基于人类蛋白质图谱(HPA)[15],我们证实SFTPD蛋白在肺的肺细胞中高度表达。预计SFTPD与SARS-CoV-2的刺突蛋白相互作用[12]。鉴于其由于SFTPD在肺中的表达明显高,未来的研究可以优先考虑SFTPD,以了解其在肺对COVID-19的独特易感性和先天免疫反应中的作用虽然SARS-CoV-2可以在血液中检测到,但阳性率仅为1% [16]。相比之下,支气管肺泡灌洗液的阳性率高达93% [16],表明血细胞不是常见的感染靶点。在420个宿主基因中,有33个基因在血液中特异性低表达,占组织特异性低表达基因的89%(33/37),确定了血液中低表达基因最多 鲜明 组织 从 的 肺。 Col6a1 显示 最组织特异性低表达(与其他组织相比变化>8倍组织,Fig. 2)的情况。COL6A1编码胶原蛋白链以维持组织完整性[14]另一方面,三种基因(DEDD 2、IL 17 RA、LCP 1)在血液中高度表达。这36个基因在血液中的独特表达是否能使血细胞免受SARS-CoV-2的攻击,这是一个需要实验验证的有趣问题。SARS-CoV-2感染后男性性激素发生显著变化[17]。我们发现420个基因中有16个在睾丸中高度表达,包括SARS-CoV-2的细胞受体ACE 2(图2)。 ACE2也在小肠中高度表达。我们检查了HPA数据,证实了睾丸、肠道、肾小管和胆囊中的选择性膜ACE2蛋白表达。这些数据表明,与新冠肺炎患者的其他组织相比,SARS-CoV-2进入相关蛋白酶包括TMPRSS 2、CTSB和CTSL。GTE X表达谱显示TMPRSS2在前列腺中明显高(图1)。 2)的情况。HPA证实了选择性蛋白表达图三. SARS-CoV-2宿主基因盒外显子在不同正常组织中的剪接谱(A)盒外显子的平均包含率(PSI)的热图对298个盒外显子进行了分层聚类,这些外显子在整个组织(肾脏、髓质除外)中表现出至少10的PSI范围,并且由于连接读数不足而缺失比率小于5。(B)基于298个 盒外 显子 的平 均 包含 率的 t-SNE可 视化 。(C)t-SNE可视化基于盒外显子的聚集包含率。我们将来自相同组织的样品的连接读段合并以计算聚集的包含率。共有371个盒外显子显示出跨组织(肾脏、髓质除外)的聚合PSI的范围至少为10,并且由于零连接读数而缺失的比率小于5。缺失值(B为0.6%,C)的0.1%插补为平均入选率在所有组织中都有一个特定的外显子盒。L. Chen和S. 郑医学信息学解锁21(2020)1004435≥-≥前列腺、胃肠道、肾脏和胰腺中的TMPRSS2。CTSB在甲状腺中特异性表达,但通常在所有其他组织中表达。HPA蛋白数据还显示CTSB蛋白在许多组织中表达。根据阈值(2倍变化),CTSL在任何组织中均无特别显著性。这些数据表明,TMPRSS 2表达比CTSB和CTSL更不普遍,并且将是限制SARS-CoV-2进入的更具选择性的靶标。半胱天冬酶在宿主细胞死亡中起重要作用[18]。虽然它们不在临时宿主基因列表中,但我们分析了它们在组织中的表达(图S1),发现它们在肺中的表达水平相对较高。因此,肺细胞可能由于高半胱天冬酶水平而死于细胞死亡2.2. 正常人我们研究了SARS-CoV-2宿主基因的选择性剪接。GENCODE(V26)[19]注释了944个宿主基因盒外显子(即,在一些转录物中包括但在其他转录物中跳过的内部外显子)。我们使用PSI(选择性剪接-选择性剪接。d-in,在0-100的范围内,参见方法)。其中,298个表达(maxPSIminPSI)10个交叉组织用于聚类分析肺中的剪接模式与脂肪、乳腺、性器官、脾和胃肠道组织(包括胃、结肠和小肠)中的剪接模式最相似(图3)。值得注意的是,一些COVID-19患者出现消化系统症状和体重减轻。基因表达和剪接模式的总体相似性, 肺,脂肪,和 胃肠道组织可能是其见图4。SARS-CoV-2宿主基因表达和剪接的群体变异(A)在肺中具有最大变异系数(CV)的前15个基因的表达。表达水平为log2(TPM+ 1)。排除平均TPM 1.0的基因。(B)肺中按其四分位距(IQR)排序的前15个盒式外显子的包含率(PSI)诱饵是Gordon等人测试的SARS-CoV-2蛋白L. Chen和S. 郑医学信息学解锁21(2020)1004436×=×对SARS-CoV-2的常见组织脆弱性。我们确定了组织独特的替代外显子,其PSI在独特的组织中比所有其他组织中的PSI大(或小)10或更多。我们发现了18个睾丸特异性盒式外显子,10个在骨骼肌中,1个在小脑中,1个在小脑半球中,1个在胰腺中(表S1)。这些差异剪接事件的生物学意义是未知的,需要进一步的实验研究。2.3. SARS-CoV-2宿主基因表达和剪接的群体差异我们探讨了SARS-CoV-2宿主基因在正常人群中的表达变化。我们通过它们的变异系数(CV,即,排除7个低表达宿主基因后,个体间肺中表达水平的随机性(平均TPM(每百万人的转录数)1)。<前15个宿主基因连同它们的CV(上图)和基因表达值一起呈现在图4A中(下图)。SARS-CoV-2受体ACE 2的随机性较高(排名第6)。虽然没有数据表明ACE 2表达与COVID-19易感性和症状严重程度相关,但低ACE 2表达可能限制病毒进入宿主细胞,导致与高ACE 2表达的结果不同。ALB在人群中显示出最大的肺表达随机性。ALB作为多种内源性分子的载体蛋白,包括激素、脂肪酸和代谢物以及外源性药物[14]。ALB在COVID-19中的作用尚未报告。在前六个基因中,CLEC 4G、CLEC 4 M和ACE 2与刺突蛋白相互作用,并可能调节SARS-CoV-2的进入。CLEC4M(也称为DCSIGNR,CD209L)是一种对HIV gp120具有高亲和力的糖蛋白,已显示其作为SARS冠状病毒的另一种受体介导病毒进入[20,21]。鉴于SARS和SARS-CoV-2之间S蛋白的相似性,以及两种病毒可以使用相同的细胞受体(ACE 2),CLEC 4 M可能介导SARS-CoV-2进入,尽管这有待实验验证。CLEC4G(也称为LSECtin)是一种C型凝集素结构域蛋白,也被预测与SARS的S蛋白相互作用,并被提出作为增强病毒感染的附着因子[22]。另一个不表达的基因(排名第14位)是CD209。预计与S蛋白相互作用的CD209参与先天免疫系统,并识别从寄生虫到病毒(如埃博拉病毒和SARS)的多种病原体[14]。有趣的是,位于CD209启动子区的遗传变异(rs4804803)与SARS严重程度相关[23]。我们发现这种变异影响CD209表达(见下文),进一步表明遗传和表达变异对疾病严重程度的贡献。REEP 6(排在第11位)与SARS-CoV-2的另一结构蛋白--膜蛋白M相互作用。REEP 6是一种受体辅助蛋白,其基因家族成员已显示增强G蛋白偶联受体的细胞表面表达(例如,气味受体和味觉受体)[24,25]。REEP6的人类突变导致视网膜色素变性[26]。有趣的是,REEP 6似乎在嗅上皮的支持细胞中特异性表达[24]。SARS-CoV-2是否会影响这些支持细胞的功能,导致嗅觉暂时丧失,将是未来研究的一个重要课题。包括SLC27A2、PKP2和PTGS2在内的七个基因与非结构蛋白相互作用。有趣的是,干扰素α介导的SLC27A2上调已显示抑制登革热病毒[27]。PKP2干扰甲型流感病毒的聚合酶复合体,从而抑制病毒复制[28]。PTGS 2(COX 2)是主要的前列腺素合酶,催化前列腺素产生的限速步骤,以响应损伤和炎症[29]。前列腺素是多种功能的激素[30]。例如,前列腺素E作用于下丘脑以触发发热,作为全身性反应,感染[31,32]。前列腺素还可作为血管扩张剂并抑制血小板聚集[33];凝血已成为COVID-19的严重并发症[34,35]。总之,我们的结果确定了宿主基因表现出最高的表达变异在正常人群中。它们在介导病毒进入以及细胞和激素反应中的已知和假定功能表明它们在响应SARS-CoV-2感染的个体差异性中的重要作用。然后,我们确定宿主基因选择性剪接事件的群体变异。我们通过四分位数范围对它们进行排名,因为拼接百分比(PSI)在0和100之间。排名前15位的盒式外显子(14个基因)在个体中表现出大范围的PSI(图11)。 4 B)。例如,一个ACADM盒外显子的中等PSI是88,但在某些个体中,PSI低至19。另一个例子是ACSL 3的盒式外显子,其PSI在某些样品中高达75-100,但中等为25。ACADM与结构蛋白相互作用M.编码中链特异性酰基辅酶A脱氢酶,催化线粒体脂肪酸β-氧化途径的初始步骤[14]。该基因的缺陷导致MCADD疾病,其特征为肝功能障碍、空腹低血糖、脑病和婴儿猝死综合征(SIDS)样疾病[36]。ACSL 3与非结构蛋白相互作用,是长链脂肪酸辅酶A连接酶家族的同工酶。它在脂质生物合成和脂肪酸降解中起关键作用[14]。2.4. 与SARS-CoV-2宿主基因表达水平的变异可以归因于邻近的遗传变异,这是表达数量性状基因座(eQTL)研究的原则。因此,我们探索了SARS-CoV-2宿主基因表达变异与人群中常见遗传变异体相关的程度根据GTEX项目的定义,如果一个基因至少有一个邻近的SNP与该基因的表达差异显著相关,则该基因被称为eGene。我们发现,除了一个SARS-CoV-2宿主基因之外,所有其他宿主基因都可以在至少一种组织中归类为eGene(表S2)。 在肺中,238个被鉴定为eGenes(图1)。 5)。SARS-CoV-2宿主基因的eQTL在更多的组织中比其他蛋白编码基因(平均19对16个组织,p3.3收到WilcoX on test)。当与包括非编码基因在内的所有其他基因相比时,这种差异甚至更大,更显着(一个平均19个vs 8个组织,p 2.2<10- 16,WilcoX on test)。 换句换句话说,群体中常见的遗传变异倾向于干扰SARS-CoV-2宿主基因在更多组织中的表达水平,而不是常规的人类蛋白质编码基因,这表明在病毒攻击后,多个器官中的表型变异的遗传贡献。例如,ACE 2在20种组织中具有有效的共同变体,尽管不在肺中。所有三种SARS-CoV-2进入相关蛋白酶(TMPRSS 2、CTSB和CTSL)在肺中具有有效的共同变体。其中,CTSB在34个组织中为eGene,CTSL在17个组织中为eGene,TMPRSS2在5个组织中为eGene。肺特异性基因SFTPD在包括肺在内的43种组织中具有有效的共同变体SNP rs4804803位于CD 209启动子区,与SARS严重程度相关,是一种有效的表达基因变异 食管(肌层)中的CD209。它也是一种有效的遗传变异,用于在皮肤(阳光照射,小腿)中表达附近的基因CLEC4G。如前所述,CD 209和CLEC 4G都被预测与SARS-CoV-2的刺突蛋白相互作用。2.5. 正常人群年龄和性别是两个已知的影响对新冠肺炎易感性的变量。儿童和年轻人(45岁)出现症状的机会较低,如果他们出现症状,症状比老年人严重[37男性似乎有更高的风险L. Chen和S. 郑医学信息学解锁21(2020)1004437图五. SARS-CoV-2宿主基因为eGenes的组织。宿主基因在附近具有共同的遗传变异,以影响其在绿色突出显示的组织中的表达水平。(有关此图例中颜色的解释,请读者参考本文的Web版本而女性的死亡率更高[40]。因此,我们检查了SARS-CoV-2宿主基因在正常肺组织中表达的可能的性别和年龄依赖性(总共578个样本,其中515个具有完整的协变量信息)。我们拟合了基因表达与性别、年龄、前五个基因分型主成分、测序平台和方案以及表达混杂因素之间的回归模型,E-EXPRESSIONResistance(PEER)的概率估计[41]。请注意,GTEX项目仅包括20岁以上的人,并在每10年6个x组(“20 - 29”,“30- 39”,....,'70-79')。TIMM10和ERGIC 1存在显著的性别差异(P<0.0005和FDR 0.1,图6A),雌性表达TIMM10和ERGIC 1高于雄性(雌性中的log2标度TPM为0.09或0.0005,图6A)。见图6。SARS-CoV-2宿主基因的性别(A)或年龄(B)依赖性表达。表达变化来自拟合回归模型的系数。表达水平为log2(TPM+ 1)。FDR 0.1用作多重比较调整的临界值。*P≤ 0.00005; * P≤ 0.0005; * P≤0.001;和 **P ≤ 0.005。L. Chen和S. 郑医学信息学解锁21(2020)1004438×××××××××××××=××=0.06当保持所有其他协变量不变时,高于男性)。注意,TIMM10和ERGIC 1的平均log2标度TPM值分别为5.2和5.9TIMM 10是必不可少的水户-表1SARS-CoV-2宿主基因丰富的疾病列表。FDR ≤0.05,富含≥4个宿主基因。基于超几何检验计算P值线粒体膜蛋白的功能是作为伴侣蛋白通过外膜转运线粒体内膜蛋白,疾病宿主基因计数总基因数P FDR[42]第42话ERGIC 1是内质网(ER)和高尔基体中的一种膜蛋白,可以控制分泌严重急性呼吸系统综合症11 80 1.210-60.0038路[43]。可以想象,这些必需基因在女性中的更高表达有助于线粒体完整性和蛋白质分泌的稳态,以对抗病毒感染。肌肉痉挛23 337 1.510-6挛缩15 1622.76×’s0.00380.0042当年龄每10年增加时,ACE2的log2标度TPM增加0.01。ACE 2的这种小但统计学显著的年龄依赖性表达增加可能有助于COVID-19的更高患病率在老年人中。GDF15 也 展品 增加 表达 与 年龄 (图6B)。GDF 15是TGF-β超家族的分泌配体[44]。增加10-610-6关节挛缩10-6呼吸衰竭15 182 1.110-5老年前期痴呆症10-50.00810.00820.014GDF15的蛋白质水平与疾病状态相关,先天性挛缩性蜘蛛状指15 194 2.410-50.014缺氧、炎症、急性损伤和氧化应激[45]。不一致-受控制的炎症(细胞因子风暴)经常在快速恶化的 COVID-19 患者 谁是 超发 老年关节痉挛10-5痴呆症22 3955.95×0.0160.028人口[46,47]。随着年龄的增长而表达降低的基因包括VKORC 1(图1)。 6B)。骨肉瘤10-6.810-50.029VKORC 1编码维生素K生物合成所必需的维生素K环氧还原酶[14]。功能性维生素K不足在老年人和高血压、2型糖尿病、慢性肾病和心血管疾病患者中更为普遍[48]。Dof- ferhoff等人发现,COVID-19患者的维生素K减少,与预后不良相关[49]。低水平的维生素K与凝血功能障碍有关[50],凝血功能障碍在严重的COVID-19中很普遍[51]。因此,建议同时给予肝素和维生素K可使COVID-19患者受益[49]。我们发现VKORC1的年龄依赖性表达为这些COVID相关症状和拟议的补救措施提供了直接见解全球发育迟缓10-5Ehlers-Danlos综合征10 103 8.3十比五骨肉瘤38 923 1.310-4无色素性皮肤黑色素瘤4 13 1.410-4感染10-4视神经萎缩19 335 1.510-40.0300.0310.0430.0430.0430.0432.6. SARS-CoV-2宿主基因相关疾病我们使用公共疾病数据库DisGeNet [52]来了解SARS-Cov-2宿主基因的病理相关性,并推断其功能重要性。DisGeNet整合了来自文献和一组公共数据源的基因-疾病关联。我们的研究在420个宿主基因中发现了365个与5181种疾病或表型我们发现SARS-CoV-2宿主基因比其他人类蛋白质编码基因更可能与疾病相关(优势比2.13(95%) C.I. 1.59-2.88),p 2.3 10 - 8,Fisher精确检验)。当与人类所有其他基因包括非编码基因相比,优势比为16.56(95%C.I.12.44<- 22.43,p 2.210 - 16,Fisher's精确检验),表明SARS-CoV-2宿主基因的功能重要性。在5181个疾病术语中,18个术语富集了SARS-Cov-2宿主基因(FDR ≤0.05,富集了≥4个宿主基因,表1)。正如预期的那样,排在第一位的疾病是SARS。有趣的是,阿尔茨海默病排名第四,表明SARS-Cov-2宿主基因的故障可能与阿尔茨海默病表型有关。严重COVID-19疾病的显著神经系统特征包括脑病、突出的躁动和意识模糊以及弥漫性皮质脊髓束体征[53]。3. 讨论在这项研究中,我们探索了SARS冠状病毒2宿主基因在正常人群中的转录组景观。我们专注于基因表达的组织和群体变异,以提供对COVID-19可变易感性和表现的即时洞察。特别是SARS-CoV-2宿主基因在正常肺组织组织可能与感染的机会和症状的严重程度有关。与脆弱组织相关的独特基因表达可能揭示SARS-CoV-2感染的细胞反应。 例如,我们发现SFTPD在肺中高度表达,并预测与SARS-CoV-2的刺突蛋白相互作用,这需要立即关注其在COVID-19中的作用的研究。另一方面,血液对感染的敏感性低得多,表现出与肺中的表达谱基本不同的表达谱。差异表达的基因比普遍表达的基因更可能解释组织易损性的变化。组织独特的选择性剪接增加了另一层调控和变异,可能有助于组织脆弱性和与SARS-CoV-2病毒的相互作用。在正常人群中影响SARS-CoV-2宿主基因表达的广泛eQTL我们的结果表明了COVID-19 eQTL分析的潜在价值COVID- 19患者的大规模基因型和/或转录组数据例如,Ellinghaus et al.[54]对严重COVID-19与呼吸衰竭进行了全基因组关联研究,并确定了两个遗传标记:rs11385942和rs657152。我们检查了GTEX资源,发现rs11385942与宿主基因FYCO1的剪接变异这可能有助于解释SNP rs11385942的疾病关联。一些SARS-CoV-2宿主基因显示出性别或年龄依赖性。间-确实, ACE2 展品 的 最强 年龄 效果, 然而当×8个SARS-CoV-2基因表现出显著的年龄效应(P<0.005和FDR <0.1,图11)。 6 B)。年龄依赖性最强的基因是ACE2(P阿尔茨海默70185310-3.2×0.0042=2.2× 10- 5,R2=0.55)。ACE 2的平均log2标度TPM为1.16。屈曲挛缩131336.8倍0.0071L. Chen和S. 郑医学信息学解锁21(2020)1004439=+×≤×+×-≥排除PEER因素后,年龄效应不显著(P0.62)。PEER因素代表表达变异性的隐藏决定因素,包括批次效应、实验混杂因素和系统性基因表达效应(例如,通过主要途径或转录因子同时激活许多基因)。去除这些混杂因素可更准确地评估年龄效应。除年龄和性别影响外,有潜在医疗状况的人群构成了COVID-19的高风险人群。研究常见的合并症对相同年龄和性别组中SARS-CoV-2宿主基因表达的影响,并交叉参考疾病依赖性基因表达标记(如果有的话)与年龄和性别依赖性COVID-19相关基因表达,这将是有趣的。我们的分析是基于与SARS-Cov-2蛋白相互作用的人类基因的临时列表。我们提醒进一步的调查需要验证这些相互作用的生物学功能4. 方法20-29岁的33份样本40-49岁,50-59岁200个样本,60-69岁190个样本,70-79岁22个样本。在578个样本中,有515个样本具有完整的协变量信息 可用 (i.e.、基因型)。 对于那些515回归模型拟合的样本中,男性349人,女性166人;每六个年龄组分别有33、36、82、187、162、15个样本。GTE x中考虑的52种组织包括:脂肪。皮下(脂肪-1),脂肪。内脏。网膜(脂肪-2),肾上腺(肾上腺),动脉。主动脉(动脉-1),动脉。冠状动脉(动脉-2),动脉。胫骨(动脉-3)、膀胱、脑、杏仁核(脑-1)、脑、前扣带回皮质BA 24(脑-2)、脑、尾状核、基底神经节(脑-3)、脑.小脑半球(脑-4)、脑.小脑(脑-5)、脑.皮层(脑-6)、脑.额叶皮层. BA 9(脑-7)、脑.海马(脑-8)、脑.下丘脑(脑-9),脑.基底神经节核(脑-10)、脑.壳核.基底神经节(脑-11)、脑.脊髓.颈. c1(脑-12)、脑.腹主动脉(脑-13)、乳腺.乳腺组织(乳腺)、颈外动脉(脑-13)viX-1),bronx.(X-2),结肠,乙状结肠 (Colon-1),Colon.4.1. SARS-CoV-2宿主基因临 时 SARS-CoV-2 宿 主 基 因 列 表 从 人 类 蛋 白 质 图 谱 网 站( https://www.proteinatlas.org/humanproteome/sars-cov-2 , 截 至2020年4月10日,基于[11])以及[12](http://korkinlab.org/wuhan)推断的基因下载共有420横(结肠-2),食管.胃肠道交界处(食管-1),食管.粘膜(食管-2),食管.肌层(食管-3),Fallopian管,心脏.心房壁(心脏-1),心脏。左心室(心脏-2)、肾脏、皮质(肾脏-1)、肾脏、髓质(肾脏-2)、肝脏、肺、小唾液腺(M.salivary.G)、肌肉。骨骼(肌肉),神经,胫骨,卵巢,胰腺,胰腺,前列腺,基因被组装起来,它们都是蛋白质编码。 他们皮肤.非SunEX姿势.耻骨上(皮肤-1),皮肤.SunEX姿势.小腿与GENCODE注释(v26)相关[19]。共944盒外显子来自基因注释。它们是基因的一些但不是全部转录物中包含的4.2. GTEx数据分析从GTEX门户(V8)(https://www.gtexportal.org/)下载在正常组织样品中分析的RNA-seq数据。具体来说,我们下载基因TPM值并将其转换为log2(TPM 1)。基于来自相同组织的样品计算平均基因表达值。我们还下载了外显子-外显子连接读段计数,以计算盒式外显子的包含率。我们需要至少20个包含性连接读数(上游和下游包含性连接读数的总和)或10个排他性连接读数以获得有效的包含率。 PSI(剪接入)指数计算为0.5包含性连接读数/(0.5包含性连接读数独家连接读数)100以表示以百分比表示的包含率。为了计算组织的盒式外显子的平均PSI,我们需要至少五个样品通过上述覆盖阈值,否则我们将使用一个或多个样品。为该组织分配了然后,我们集中在298盒外显子其显示出至少10(maxPSI)的PSI范围 minPSI 10)在所有组织中(由于读数不足,排除了剪接分析中的覆盖率)和小于5个对于t-SNE可视化,将除了有采用合格样品的方法,我们还通过汇集来自相同组织样品的所有连接读数获得了组织中盒式外显子的聚集的包含共显示371个盒式外显子跨组织(肾脏、髓质除外)的聚合PSI范围至少为10,并且由于零映射连接读数(0.1%缺失值)而小于5个这两种方法的t-SNE可视化结果相似。顺式eQTL的qval 0.05的eGenes列表从GTEX下载。用于肺表达分析的下载协变量包括前5个基因分型主成分、使用E表达抗性概率估计(PEER)方法[41]鉴定的60个表达混杂因素、测序平台、测序方案、性别和年龄。有395份来自男性的肺样本和183份来自女性的肺样本年龄分布为:(皮肤-2)、小肠、小肠、脾脏、胃、睾丸、甲状腺、子宫、阴道、全血(全血)。4.3. 其他数据分析基因-疾病关联从DisGeNet数据库(v6)[52]https://www.disgenet.org/下载。DisGeNet数据库整合了来自多个源数据库的人类基因-疾病关联,包括策划和推断的关联。所有统计分析均在R(3.6.1)中进行。除非另有说明,P作者贡献L.C.和S.Z.构思工作并设计研究; L.C.进行数据分析; L.C.和S.Z.解释结果并撰写手稿。竞合利益没有人申报。致谢这 项 工 作 得 到 了 美 国 国 立 卫 生 研 究 院 的 支 持 [ 授 权 号R01GM137428给L.C.,R01MH116220和R01NS104041至S.Z.]。创始来源在研究的进行和文章的准备中没有任何作用附录A. 补充数据本 文 的 补 充 数 据 可 在 https : //doi 网 站 上 找 到 。org/10.1016/j.imu.2020.100443。引用[1] 王丹,胡斌,胡聪,朱锋,刘X,张杰,等.武汉市2019年新型冠状病毒感染的肺炎138例住院患者临床特征分析中国 美国医学会杂志2020;323(11):1061-9。[2] Colaneri M,Sacchi P,Zuccaro V,Biscarini S,Sachs M,Roda S,Pieri TC,Valsecchi P,PirallaA,Seminari E,Di Matteo A,Novati S,Maiocchi L,Pagnucco L,Tirani M,L. Chen和S. 郑医学信息学解锁21(2020)10044310Baldanti F,Mojoli F,Perlini S,Bruno R,The Covid Irccs San Matteo Pavia TaskF. 2020年2月21日至28日,意大利北部帕维亚一家教学医院冠状病毒病(COVID-19)早期发现的临床特征。25.第25章大结局[3] SiordiaJr JA. COVID-19的流行病学和临床特征:当前文献综述。临床病毒学杂志2020;127:104357。[4] Huang C,Wang Y,Li X,Ren L,ZhaoJ,Hu Y,Zhang L,Fan G,XuJ, GuX,Cheng Z,Yu T,XiaJ,Wei Y,Wu W,Xie X,Yin W,Li H,Liu M,XiaoY,Gao H,Guo L,XieJ,王刚,姜荣,高志,金勤,王杰,曹波。中国武汉2019新型冠状病毒感染患者的临床特征。柳叶刀2020;395:497-506.[5] MaoL,Jin H,Wang M,Hu Y,Chen S,He Q,et al.神经系统表现中国武汉2019年冠状病毒病住院患者。JAMANeurol 2020;77(6):683-90。[6] 王毅,陈毅,秦勤.新出现的2019新型冠状病毒肺炎(COVID-19)的独特流行病学和临床特征涉及特殊控制措施 医学病毒学杂志2020;92(6):568-76。[7] Hu Z,Song C,Xu C,Jin G,Chen Y,Xu X,Ma H,Chen W,Lin Y,ZhengY,WangJ,YiY,Shen H. 24
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功