没有合适的资源?快使用搜索试试~ 我知道了~
SARS-CoV-2与人类蛋白质的相互作用网络研究
+医学信息学解锁20(2020)100413SARS-CoV-2-人类蛋白质相互作用网络Babak Khorsand*,Abdorreza Savadi,Mahmoud Naghibzadeh伊朗马什哈德Ferdowsi大学工程学院计算机工程系A R T I C L EI N FO保留字:COVID-19SARS-CoV-2状病毒蛋白质相互作用宿主-病原体蛋白质相互作用蛋白质相互作用预测A B S T R A C T严重急性呼吸综合征冠状病毒2(SARS-CoV-2)是一种新型冠状病毒,导致2019年冠状病毒病大流行,感染了全球213个国家的1200多万患者,导致超过56万人死亡。在感染的第一周内没有症状会增加病毒传播的速度。受感染人数的增加及其高死亡率要求立即开发适当的诊断方法和有效的治疗方法。与其他病毒类似,SARS-CoV-2需要与宿主蛋白相互作用才能到达宿主细胞并复制其基因组。因此,病毒-宿主蛋白质-蛋白质相互作用(PPI)的鉴定可能有助于预测病毒的行为和抗病毒药物的设计。使用实验方法鉴定病毒宿主PPI非常耗时且昂贵。对于许多初步调查,计算方法可能是可接受的替代方法。在这项研究中,我们开发了一种新的方法来预测SARS-CoV-2-人类PPI。我们的模型是一个三层网络,其中第一层包含与SARS-CoV- 2蛋白最相似的甲型流感病毒蛋白。第二层包含甲型流感病毒蛋白和人蛋白之间的蛋白质-蛋白质相互作用。最后一层利用前两层的聚类系数网络特性揭示了SARS-CoV-2蛋白和人蛋白之间的蛋白质为了进一步分析我们的预测网络的结果,我们研究了SARS-CoV-2蛋白靶向的人类蛋白,并报告了人类PPI网络中最核心的人类蛋白。此外,还对以往研究中的差异表达基因进行了研究,并报道了SARS-CoV-2-human network的PPI,其中人蛋白与上调基因相关。1. 介绍冠状病毒(CoV)是一个大家族的病毒,其可以引起从普通感冒到严重呼吸道感染的疾病[1]。此外,一些类型的CoV是人畜共患的,并且它们可从动物传播到人。严重急性呼吸道综合征(SARS-CoV)是一种冠状病毒,来自果子狸[2]和马蹄蝠[3],于2002/2003年在中国南方出现,并传播到26个国家,有8096例感染病例,导致774例死亡[4]。中东呼吸综合征(MERS-CoV)是另一种来自单峰骆驼的疾病,在阿拉伯半岛发现了2494例感染病例,导致858例死亡[5]。最新版本的冠状病毒称为新型冠状病毒(SARS-CoV-2)出现在武汉[6],这是一个拥有1100万人口的中国城市,导致2019冠状病毒病(COVID-19)[7]。SARS-CoV-2可能来自蝙蝠[8]或水貂[9]。COVID-19最初于2019年12月被发现,截至1月22日,共感染了835例病例,导致25人死亡,2020年[10]。截至2020年2月2日,感染人数增加到17400例,导致362人死亡[11],超过40000例导致截至2020年2月10日,800人死亡[12]。感染数量呈指数增长,倍增期为1.8天[13]。通过收集来自世界卫生组织(WHO)的180份报告,我们建立了一个数据库,以显示COVID-19如何在全球范围内传播超过1200万例,并导致超过56万名受害者死亡,直到2020年7月10日。图1- 3显示了SARS-CoV-2如何在四个月内成为世界各地的流行病,以及它如何每天在不同国家杀死数千人。CoV是单链正义RNA(ssRNA)病毒,其属于巢病毒目、冠状病毒科和正冠状病毒亚科。α冠状病毒、β冠状病毒、δ冠状病毒和γ冠状病毒是其四个不同的属,其中β冠状病毒是最致病的属[14]。β冠状病毒有五个亚属,包括恩贝科病毒、Sarbecovirus、Merbecovirus、Nobecovirus和Hibecovirus [15]。* 通讯作者。电子邮件地址:khorsand@mail.um.ac.ir(B.Khorsand)。https://doi.org/10.1016/j.imu.2020.100413接收日期:2020年6月20日;接收日期:2020年7月11日;接受日期:2020年在线预订2020年2352-9148/©2020的 自行发表通过Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)中找到。可在ScienceDirect上获得目录列表医学信息学期刊主页:http://www.elsevier.com/locate/imuB. Khorsand等人医学信息学解锁20(2020)1004132包括OC 43和HKU 1型在内的恩贝病毒通常会导致轻度至中度的上呼吸道疾病,如普通感冒。SARS-CoV和SARS-CoV-2属于Sarbecovirus(SV)亚属,MERS-CoV属于Merbecovirus亚属。病毒是一种寄生虫,它们缺乏在宿主体外生存和繁殖的能力。病毒蛋白与宿主蛋白之间的蛋白质相互作用(Protein-Protein Interaction,PPI)是病毒蛋白到达宿主细胞所必需的。因此,识别病毒-宿主PPI网络是预测病毒行为的关键,进而可以用于设计抗病毒药物。生物分子荧光互补[16]、免疫共沉淀[17]和酵母双杂交是检测病毒宿主PPI的一些实验方法。这些方法都是昂贵的,非常耗时,而计算方法是快速和廉价的预测病毒宿主PPI。许多研究证实了计算方法在PPI预测中的实用性,而进一步的研究可以提高这些方法的性能,特别是在准确性方面。模型训练是其中使用实验开发的PPI的提取特征来训练计算模型的一条研究路线。在模型的学习阶段,不同的研究中使用了不同的分类器。Sun使用深度学习[18],而Dyer [19],Chatterjee [20],Mei [21]和Eid [22]应用支持向量机来预测病毒宿主PPI。Nourani使用朴素贝叶斯[23]。决策树相关分类器是Basit [24]采用的方法。随机森林是杨[25]和巴曼[26]遵循的方法。Leite[27],Zahiri [28]和Mei [29]遵循的方法分别是k-最近邻,多层感知器和AdaBoost。另一方面,研究人员研究不同的病毒,PPI网络。Zhao预测了HIV 1-人类PPI网络[28],Khorsand发现了甲型流感病毒-人类PPI网络[29],Ray预测了HCV-人类PPI网络[30],Chan揭示了西尼罗河病毒病毒-人PPI网络[31],Duran致力于疱疹病毒-人PPI网络[32]。特征学习模型是从另一个角度来看待预测病毒-宿主PPI网络.Alguwaizani使用重复模式和氨基酸组成[33],K?sesoy使用基于位置的氨基酸编码[34],Mir使用结构相似性[35],Guven-Maiorov使用界面相似性[36],Khorsand使用网络拓扑和基因本体[29]在他们对学习PPI网络的研究中。在本研究中,如图4所示,我们通过构建一个新的三层网络来构建SARS-CoV-2-人类PPI网络,其中第一层表示甲型流感病毒-人类PPI网络,第二层表示甲型流感病毒-SARS-CoV-2相似性网络,第三层根据前两层的聚类系数规则揭示SARS-CoV-2-人类PPI网络。在本文的其余部分,在第二节中,通过蛋白质基本局部比对搜索工具(Balstp)对SARS-CoV-2蛋白进行了正向对数检测。由于其所有的直系同源物都属于SV,我们决定对整个SV家族进行研究。提出了一种检测甲型流感病毒(AIV)SV蛋白同源物的新方法最后,通过构建多层网络,我们构建了SV-人类PPI网络,SARS-CoV-2-人类PPI网络是可提取的。在第3节中,报告了SARS-CoV-2的一些特征,这些特征可以用于机器学习方法来预测PPI网络。通过对构建的SARS-CoV-2-Human PPI网络的分析,得到了SARS-CoV-2靶向的主要蛋白。最后,对两个可用的基因表达综合系列(GSE)中的差异表达基因进行了研究,并标记了SARS-CoV-2-human PPI网络中上调基因中含有人蛋白的PPI。简短的结论放在第4节。Fig. 1. 图1-a显示了不同国家的COVID-19确诊病例在达到30万例时的传播速度,而图1-c显示了每个国家因COVID-19而牺牲3万例所需的时间。图1-b显示了不同国家的COVID-19确诊病例总数,图1-d显示了COVID-19造成的死亡总数。B. Khorsand等人医学信息学解锁20(2020)1004133----2. 材料和方法SARS-CoV-2的基因组有29903个核苷酸[37]和14种蛋白质。对所有这些蛋白进行Blastp [38],以鉴定具有最高序列同一性的病毒蛋白(VP)。对于每种SARS-CoV-2蛋白,具有最高分数的前三种蛋白报告于表1中。SARS-CoV-2及其所有同源物都属于SV,因此我们决定对整个SV蛋白进行研究。SV有1772个VP,属于158个不同的菌株。选择含有至少三个VP的菌株。113个菌株(含1726个VP)根据其序列长度(从小于50个残基的VP到大于6800个残基的VP)分为14类。14个组中的每一个,聚类成具有至少98%序列同一性的组。此后,在每组内,在具有大于98%的序列同一性的VP中,选择代表性VP(与其它VP具有最高序列同一性的VP)。经过这两个聚类步骤,从1726个VP中选择总共294个VP。由于SV的致病性和传播性与呼吸道病毒的其他家族之一AIV的致病性和传播性相似[39],并且在PPI 数据库(如Intact [40]和VirusMINT[41])中存在AIV蛋白和人蛋白(HP)之间的许多实验PPI,因此我们探测AIV蛋白以检测其中的SV直系同源物,以检测可能的HP受害者。为了构建AIV-人PPI网络,从STRING [42]、Intact [40]、DIP [43]、VirusMINT [41]和BioGRID [44]中提取了11040个AIV-人PPI。在这些PPI中,选择了10878种属于H1N1、H3N2和H5N1亚型的PPI。从45种不同菌株的2966株HP和119株VP中选择PPI。将119个选择的VP聚类成组,使得在每个聚类中,每对的相互序列同一性高于98%。在每组中,选择在相应组的所有其他VP中具有最高平均序列同一性得分的代表。该过程导致从119个AIV蛋白的集合中选择74个VP。为了检测AIV蛋白中SV蛋白的直向同源物,在294种SV蛋白中的每一种和74种AIV蛋白中的每一种之间计算四个不同的分数I. 一级结构相似性评分:对所有21756个序列对进行Smith-Waterman序列比对[45],任何开放缺口罚分,但延伸缺口罚分为2分。将块替换矩阵X62(BL0SUM62)视为评分矩阵X。对于每一对,局部比对得分被认为是其一级结构相似性PS得分。II. 二级结构相似性评分:为了简单起见,每个蛋白质的二级结构(SS)由3种类型的SS,即螺旋,链和卷曲表示。三个不同的分数,从每对的SS中提取。a. 普通形式:21756对中的每一对的SS上的局部比对,没有任何开放空位罚分,但对于延伸空位具有2个罚分。在相似性矩阵中,每个匹配的3个信用点被认为是其比对得分。对于螺旋与螺旋X或链1的错配以及螺旋X与链3的错配,被认为是其比对评分。对于每一对,比对分数的总和被认为是SS相似性分数,称为SSO。b. 紧凑形式:SS的紧凑形式与前一步的参数的局部对齐。通过消除每个SS类型的后续重复,简单地获得了SS紧凑型 例如,考虑 到“HHHHHHHHHCCCCHHHHHCCCCEEEEECCHHHHH“ 作 为蛋白质的SS,其SS紧凑形式将是“HCHCECH”。对于每一对,比对分数的总和被认为是SS相似性分数,称为SSC。c. 最长公共子串:每对之间连续匹配的最大数量,被视为其SS相似性得分,称为SSLCS。III. 可访问性相似度得分:残余物的可渗透表面积(ASA)是其与溶剂接触的残余物的表面积残基的可及性是折叠蛋白质中该残基的ASA超过该残基的最大可能ASA,其由Tien计算[46]。对于每种蛋白质的任何残基,计算可及性,可及性评分小于0.25的每个残基被认为是隐藏的。可访问性得分在0.25和0.35之间被认为是中等,0.35被认为是暴露的。因此,每种蛋白质都由3种类型的ASA序列表达,包括埋藏,中间和暴露。从每对的ASA中提取三个不同的分数图二. 图2-a显示了每1000例COVID-19病例的死亡人数(死亡率)。图2-b显示了各个国家每10万人的COVID-19病例数。B. Khorsand等人医学信息学解锁20(2020)1004134---a. 普通形式:21756对中的每一对的ASA上的局部比对,没有任何开放空位罚分,但对于延伸空位具有2个罚分。在相似性矩阵中,每个匹配的3个积分被认为是其比对得分。中间体与暴露的1个信用点不匹配,中间体与埋藏的不匹配1被认为是其对齐评分。对于暴露与埋藏的不匹配,3被认为是其对齐评分。对于每一对,比对分数的总和被认为是ASA相似性分数,称为ASAO。b. 紧凑形式:使用前一步的参数对ASA的紧凑形式进行局部对齐通过消除每个ASA类型的后续重复,简单地获得ASA紧凑形式例如,考虑到分子功能(MF)表示基因产物的生化活性,细胞成分(CC)表示基因在细胞中的活性部位对于每个域,有一个层次有向无环图,其中每个节点代表一个GO术语。为了找到两种蛋白质的GO术语的语义相似性,使用相关性方法[48],其取决于每种蛋白质对于21756个AIV-SV对中的每一个,计算3个语义相似性分数,称为BPS,MFS,CCS,并且将它们的平均值视为GO语义相似性分数,称为GOS。最终评分是所有上述评分的调和平均值,计算公式为:Sc i=7+k、(2/PS)+(1/SSO)+(1/SSC)+(1/SSLCS)+(1/ASAO)+(1/ASAC)+(k/GOS)作为蛋白质的ASA,其ASA紧密形式将是“EXBXE”。对于每一对,比对分数的总和被认为是称为ASAC的ASA相似性分数。IV. 基因本体语义相似度评分:两个蛋白质的基因本体(GO)术语的语义相似性可以揭示功能相似性,从而增加它们之间可能相互作用的概率。GO [47]包含三个域:对于一些VP,GO术语不可用,定义k以显示具有GO术语的域的数量为了避免被零除问题,如果在VP的所有GO域中不存在任何有效的GO项,则GOS将被设置为1并且k将被设置为零。最后,创建了具有294行和74列的分数矩阵。评分矩阵的最低分为13分,中位数为图3.第三章。 图图 3-a显示了COVID -19 的整体传播分布。 图图 3-b和图 3-c分 别 示出了日扩散和死亡分布。B. Khorsand等人医学信息学解锁20(2020)1004135见图4。 预测SARS-CoV-2-人类蛋白质相互作用网络示意图。表1SARS-CoV-2直系同源物。ID蛋白长度身份直系同源物ID蛋白taxIDTaxonomyP0DTD1复制酶多聚蛋白1ab7096百分之九十五点七A0A2R3SV02非结构多聚蛋白1ab1508227蝙蝠SARS样冠状病毒95.3% A0A2R3SUX586.2% P0C6X7复制酶多聚蛋白1 ab 694009人类SARS冠状病毒P0DTC 1复制酶多聚蛋白1a 4405 95.6%A0A2R3SV 02非结构多聚蛋白1 ab 1508227蝙蝠SARS样冠状病毒95.1% A0A2R3SUX580.7% A0 A0 U1 WJY 1 Orf 1ab多聚蛋白1503302 BtRs-BetaCoV HuB 2013 P0 DTC 2刺突糖蛋白1273 80.5%A0 A2 R3 SUW 7刺突蛋白1508227蝙蝠SARS样冠状病毒79.8% A0A2R3SUW977.1% A0A0U2IWM2刺突糖蛋白1739625 SARS样冠状病毒P0DTC3蛋白3a 275 92.1% A0A2R3SUX11508227蝙蝠SARS样冠状病毒90.9% A0A2R3SUV 9A0A023PTR5蛋白3 1487703菊头蝠冠状病毒P0DTC4包膜小膜蛋白75百分百A0A2R3SUY7包膜小膜蛋白1508227蝙蝠SARS样冠状病毒P0DTC5膜蛋白222百分之九十四点七百分之九十四点七百分之九十八点六Q3I5J3Q3LZW9A0A2R3SUX3包膜小膜蛋白包膜小膜蛋白膜蛋白3493444427361508227蝙蝠冠状病毒Rp 3/2004蝙蝠冠状病毒HKU 3蝙蝠SARS样冠状病毒百分之九十一点七百分之九十一点四Q0Q472Q3LZX9膜蛋白膜蛋白389167442736蝙蝠冠状病毒279/2005蝙蝠冠状病毒HKU3P0DTC6非结构蛋白661百分之九十三点四A0A2R3SUW51508227蝙蝠SARS样冠状病毒百分之七十三点八U5WIP81415852蝙蝠SARS样冠状病毒WIV1百分之七十三点八A0A0U2PPC81739625SARS样冠状病毒WIV 16P0DTC7蛋白7a121百分之八十八点四A0A2R3SUY11508227蝙蝠SARS样冠状病毒百分之八十八点五公司简介蛋白7a349344蝙蝠冠状病毒Rp 3/2004百分之八十八点五Q3LZX7蛋白7a442736蝙蝠冠状病毒HKU3P0DTD8蛋白质7b44百分之八十八点一A0A0U1WHL8 1503303 BtRs-BetaCoV YN2013百分之八十五点七Q3 I5 I9蛋白7 b 349344蝙蝠冠状病毒Rp 3/2004B. Khorsand等人医学信息学解锁20(2020)1004136百分之八十五点七P0 C5 A9蛋白7 b 389167蝙蝠冠状病毒279/2005P0DTC8非结构蛋白8121百分之九十四点二A0A2R3SUZ91508227蝙蝠SARS样冠状病毒百分之五十八点七D2DJX2722424SARS冠状病毒Rs_672/200658.7% U5WI34 1415851蝙蝠SARS样冠状病毒RsSHC014 P0DTC9核蛋白419 94.3% A0A2R3SUZ1核蛋白1508227蝙蝠SARS样冠状病毒94.3% A0A2R3SUX6A0A023PSY2核蛋白1487703菊头蝠冠状病毒P0DTD2蛋白质9b97百分之七十六点五A0A023PUR2蛋白131487703菊头蝠冠状病毒74.2%Q3LZX3蛋白质9b442736蝙蝠冠状病毒HKU374.2%Q3LZU1蛋白N338606蝙蝠冠状病毒HKU 3 -3P0DTD3蛋白1473百分之九十二点九A0A2R3SV 091508227蝙蝠SARS样冠状病毒百分之八十点一Q3I5K1ORF14349342蝙蝠SARS冠状病毒Rp1百分之八十点一Q3I5J8ORF14349343蝙蝠SARS冠状病毒Rp2B. Khorsand等人医学信息学解锁20(2020)100413749.5,第三分位数得分为53.5,最高得分为72。我们认为53.5(其第三分位数得分)作为直系同源物阈值。该阈值可用于调整预测PPI网络的大小,预测PPI网络的大小与PPI网络的大小成反比。增加阈值会减小PPI网络的大小,而降低阈值会增加PPI的数量。对于每种SV蛋白,得分高于53.5的AIV蛋白被认为是其直系同源物。对于每种SV蛋白,所有其AIV直系同源物的HPs对于从前一步骤得到的每种SV蛋白及其HP在社交网络中,如果A是B的朋友,B是G的朋友,则A和G之间存在可能的友谊关系。现在,如果A是B、C、D和E的朋友,B、C、D和E是G的朋友,那么A和G之间的友谊关系的概率会高得多。我们使用这个规则来过滤前一步构建的可能的交互。每个SV蛋白可能有几个AIV直系同源物,因此每个SV蛋白可能与具有多个边缘的HP连接(每个边缘来自一个直系同源物)。为了限制预测相互作用的数量,进行了两次过滤过程。在SV-人类PPI网络的所有边缘中,消除了单个边缘。将多个边缘转换为一个简单的边缘,该边缘通过其相互作用因子的直系同源物得分之和减去整个中位数得分(49.5)进行加权。权重小于10的边随后被消除。例如,如图5所示,将I1、I2和I3视为AIV蛋白,C1、C2和C3视为SV蛋白,H1、H2、H3、H4和H5视为人蛋白。现在考虑I1、I2和I3是C1的直系同源物,得分分别为58、54和59。此外,考虑I2和I3是C2的直系同源物,得分为61和55。最后,考虑I3是C3的直系同源物,得分为56。假设H1和H2是I1的相互作用子,H1、H2、H3是I2的相互作用子,H1、H4、H5是I3的相互作用子边的权重在表2中计算。因此,在我们示例的最终SV-人类PPI网络中,从13个可能的交互(边)中,只会创建三个交互(C1表2样本网络边权值的计算边权重C1C1C1C1C1C2C2C2C2C2C3C3C33. 结果和讨论研究SARS-CoV-2基因组和蛋白质导致以下观察结果。3.1. SARS-CoV-2基因组对SARS-CoV-2基因组的分析表明,SARS-CoV-2基因组中腺嘌呤占29.9%,胸腺嘧啶占32%,胸腺嘧啶占18.4%。鸟嘌呤占19.6%。3.2. A、T、GT、TC、AC、GA、CAA和GAA是SARS-CoV-2中重复序列串联重复序列,即连续重复的基序,其核心子序列少于7个,被称为微卫星,可以帮助结构分析。所有SARS-CoV-2微卫星均采用FMSD(快速微卫星发现方法)提取[49],并报告于表3中。3.3. 亮氨酸、缬氨酸、丙氨酸、苏氨酸和丝氨酸是SARS-CoV-2蛋白图6-a显示了SARS-CoV-2蛋白中每个氨基酸的频率,称为氨基酸组成。图6-b显示了所有SARS-CoV-2蛋白的每个氨基酸的频率图五. 一个多部分网络,其中第一层显示AIV蛋白(I1,I2和I3)和SV蛋白(C1,C2和C3)之间的相似性,绿色边缘。第二层显示AIV蛋白和人类蛋白(H1,H2,H3,H4和H5)之间的相互作用,蓝色边缘。第三层显示了SV蛋白和人类蛋白之间可能的相互作用,红色边缘。三种红边类型的厚度表明,股票代码的可能是更好的候选人SV-人类PPI网络。(For对本图中颜色图例的解释,读者可参考本文的网络版··B. Khorsand等人医学信息学解锁20(2020)1004138表3SARS-CoV-2的微卫星核心起于重复核心起于重复核心起于重复一2987034CTT147563TGT256423不110748TTC223203AAT257573TC78135AGT230883CGA261913GT204865AAG31883GTG285563AC131624GAT32053TGC289343GA229544CTT47363CAA289873GAA30553ATG113663CTG290213GAA30733ATC119103AAG293893TTC6263TGA138953图六、 图图 6-a显示SA RS-CoV-2 蛋 白 的氨基酸组成。 图 6-b显示了 SARS-CoV-2 蛋 白 的全氨基酸分布。见图7。 图7-a显示了SARS-CoV-2蛋白的二级结构。浅粉色、中粉色和深粉色分别表示卷曲、螺旋和延伸结构。图7- b显示SARS-CoV-2蛋白的可及表面积。梯度的两个最低颜色表示掩埋的残留物,并且梯度的其他颜色显示暴露的残留物。(有关此图例中颜色的解释,请读者参考本文的Web版本3.4. SARS-CoV-2的大部分氨基酸都是暴露的,具有螺旋或卷曲结构提取了SARA-CoV-2蛋白的二级结构,并将其作为图7-a显示了SARS-CoV-2中螺旋、螺旋X和延伸proteins.此外,计算每种SARS-CoV-2蛋白的可及表面积。小于0.2的值被认为是掩埋的,而大于0.2的值被认为是暴露的。如图7-b所示,描绘了每种SARS-CoV-2蛋白的所有氨基酸的可及表面积。B. Khorsand等人医学信息学解锁20(2020)1004139见图8。图8-a显示了P0 DTC 7-人蛋白质-蛋白质相互作用网络。P0DTC 7蛋白以红色节点显示。其IAV直系同源物显示为绿色节点,其与218个HP(蓝色节点)具有389个相互作用。选择权重大于10并且与至少2个IAV蛋白连接的49个HP作为P0 DTC 7蛋白的最终相互作用物,因此最终的P0 DTC 7-人PPI网络是红色节点和49个蓝色节点之间的二分网络,所述红色节点和49个蓝色节点通过红色边连接图8-b显示了与SARS-CoV-2蛋白相互作用的人蛋白-蛋白相互作用网络的诱导子图。(For对本图中颜色图例的解释,读者可参考本文的网络版3.5. SARS-CoV-2-人类预测PPI网络在11个VP和1898个HP之间有7201个P0 DTC 7是SARS-CoV-2的一种蛋白。从74个IAV蛋白中,选择与P0DTC7相似性得分高于53的18个IAV蛋白作为其直系同源物,其在图8a中以绿色显示。这18个AIV蛋白与218个HP有389个相互作用,这些HP以蓝色边缘显示。在这218个HP中,49个HP连接到至少两个IAV蛋白,并且具有大于10的权重。因此,它们被选为P0DTC7的最终HP相互作用物,它们与P0DTC7的PPI用红色边缘显示(见图1)。 8a)。对所有SV蛋白采用相同的策略,导致SV-人PPI网络在201个SV蛋白和2679个HP之间具有87894个相互作用。从整个SV-人PPI网络中,11个VP和1898个HP之间的7201个相互作用属于SARS-CoV-2-人PPI网络。3.6. Q86 VP 6、Q92905、Q13573和P01106是SARS-CoV-2人类相互作用子中最中心的人类PPI网络(HPPIN)在19985个HPs之间有261624个相互作用。1898个HPs的HPPIN的诱导子图,图9.第九条。SARS-CoV-2蛋白靶向的122个富集的人蛋白的分子功能。B. Khorsand等人医学信息学解锁20(2020)10041310与SARS-CoV-2相互作用的HPPINS被称为HPPINS,如图2所示。 8b.HPPINS在1756个HP之间有18342个相互作用。通过计算不同的中心性度量,以下HP是HPPINS中最重要的节点,可以作为实验PPI测试的良好候选者。Q86VP6(cullin相关NEDD 8解离蛋白1)与P0DTC 1、P0DTC 4和P0DTC 6的相互作用程度为392(最高程度),接近度为0.52,辐射度为0.84,介数为0.06。Q92905(COP9信号体复合物亚基5)的度为365,接近度为0.52,辐射度为0.84(最高辐射度),介数为0.06,与P0DTC4,P0DTC6,P0DTD2,P0DTD8和A0A663DJA2相互作用。P01106(myc原癌基因蛋白)与A0A663DJA2相互作用的程度为311,接近度为0.5,辐射度为0.83,介数为0.07(最高介数)。Q13573(含SNW结构域蛋白1)与P0DTC4、P0DTD8和P0DTD1相互作用,其度为307,接近度为0.52(最高接近度),辐射度为0.83,介数为0.045。3.7. GO富集分析SARS-CoV-2-人PPI网络有1898个HP,其中1130个HP与至少两个SARS-CoV-2蛋白相互作用。使用PANTHER分类系统[50]对这1130个HP进行GO富集分析,分为三个单独的类别,以检测富集的生物过程、分子功能和细胞组分。提取了122个富集的分子功能、199个富集的细胞组分和748个富集的生物过程,p值小于0.01图9显示了用REVIGO [51]描绘的富集的分子功能。3.8. SARS-CoV-2-人PPI网络的727个相互作用属于215个差异表达的HPsGSE 150316是通过高通量测序实验对五个不同器官中的五个COVID-19阳性患者和五个阴性对照进行的表达谱分析。我们比较了阳性患者和阴性对照之间每个器官的基因表达数据,并将其log2倍数变化高于1(过表达至少两次)的基因报告为差异表达基因(DEG)。此后,我们在我们预测的SV-人类网络中搜索SARS-CoV-2蛋白靶向的HP中的这些DEG并标记它们。在肺中检测到20个DEG,它们在SV-人PPI网络中产生255个相互作用。在心脏中检测到95个DEG,在SV-人PPI网络中产生2099个相互作用。在肝脏中检测到9个DEG,它们在SV-人PPI网络中产生104个相互作用。在肾脏中检测到SiXDEG,其在SV-人PPI网络中产生27种相互作用。最后,在肠道中检测到35个DEG,它们在SV-人PPI网络中产生634个相互作用。GSE 1739 [52]是一种通过阵列实验对10个SARS患者和4名阴性对照。我们比较了阳性患者和阴性对照的基因表达数据,并将其log2倍数变化高于1的基因报告为DEG。此后,我们在我们预测的SV-人类网络的HP中搜索这些DEG由 于 它 的 直 系 同 源 物 中 有 一 个 属 于 Sarbecovirus , 我 们 决 定 对Sarbecovirus的整个蛋白进行研究。最初,我们根据蛋白质的长度对其进行聚类,并排除每组中具有高序列同一性的蛋白质。此后,我们通过一级结构、二级结构、可及性和基因本体语义相似性发现了相似的甲型流感病毒蛋白。最后,我们通过将Sarbecovirus蛋白质连接到与至少两个其相似的甲型流感病毒蛋白质具有相互作用的人类蛋白质,并根据其聚类系数对它们进行加权,从而构建了一个加权Sarbecovirus-人类蛋白质-蛋白质相互作用网络。我们的最终数据集包含87894 Sarbecovirus和人类蛋白质之间的蛋白质-蛋白质相互作用。前7201个相互作用属于SARS-CoV-2-人类蛋白质-蛋白质相互作用。构建的加权蛋白质-蛋白质相互作用网络可在www.example.com上公开获得http://bioinf.modares.ac。ir/software/complexnet/Corona/CoronaPPIN.tX t.竞合利益作者声明,他们没有已知的可能影响本文所报告工作引用[1] Khani H,Tabarraei A,Moradi A.伊朗golestan省流感样症状患者冠状病毒感染调查。mljgoums 2018年11月;12(6):1-4。[2] 作者:J.SARS、MERS和太阳黑子周期。 Curr Sci 2017;113(8):1501。[3] 陆HKH,李X,冯J,刘SKP,胡PCY.SARS冠状病毒的分子流行病学、进化和发生。Infect Genet Evol2019;71:21-30.[4] 组织WH. 2002年11月1日至2003年7月31日发病的SARS疑似病例摘要。 2003年。[5] 杨晓萍,李晓萍. MERS-CoV在骆驼-人界面上的溢出。Elife2018;7:e31257.[6] Huang C, et al.中 国 武 汉 2019新 型 冠 状病 毒 感 染 患 者 的临 床 特 征 。 柳 叶 刀2020;395(10223):497-506。[7] Remuzzi A,Remuzzi G. COVID-19和意大利:下一步是什么?Lancet2020.[8] ZhouP,et al. 一场与可能源自蝙蝠的新型冠状病毒相关的肺炎疫情。Nature2020.[9] Zhu H,et al.使用深度学习算法对武汉2019新型冠状病毒的宿主和免疫力预测。2020年。四.生物技术[10] 王C,霍比PW,海登FG,高GF。一种新型冠状病毒爆发的全球健康问题。柳叶刀2020;395(10223):470-3。[11] Bonilla-Aldana DK等人,“ProMED报告的冠状病毒感染,2000年2月至2020年1月。Trav Med InfectDis 2020:101575.[12] 作者:Li G,De Clercq E. 2019年新型冠状病毒(2019- nCoV)的治疗选择。Nature Publishing Group;2020.[13] Cheng ZJ,ShanJ.2019新型冠状病毒:我们在哪里,我们知道什么。感染2020。[14] 陈毅,刘强,郭东. 新兴冠状病毒:基因组结构,复制和发病机制。J MedVirol 2020.[15] Su S等,流行病学,基因重组和冠状病毒的发病机制。TrendsMicrobiol2016;24(6):490-502.[16] Hu CD,Chinenov Y,Kerppola TK.使用双分子荧光互补在活细胞中bZIP和Rel家族蛋白质之间的相互作用的可视化。分子细胞2002;9(4):789-98.[17] Golemis E.蛋白质相互作用:分子克隆手册。北京:人民出版社,2005.[18] Sun T,Zhou B,Lai L,PeiJ.使用深度学习算法进行基于序列的蛋白质相互作用预测。 BMC Bioinf 2017; 1 - 8(1):1-8.[19] Dyer MD,Murali TM,Sobral BW.监督学习和预测人类和HIV蛋白质之间的物理相互作用。感染遗传学进化2011;11(5):并做了标记SV-人类PPI网络中的106 ×DEGs 使 6319 in-917-23[20] [10] Chatterjee P,Basu S,Kundu M,Nasipuri M,Plewczynski D. PPI_SVM:使用机器学习、域-域亲和力和在这9072个SV-人PPI网络的相互作用中,727个相互作用属于215个HP与SARS-CoV-2蛋白之间的SARS-CoV-2-人PPI网络。我们在数据库中标记了所有这些互动。4. 结论在目前的研究中,通过收集世界卫生组织的180份报告,我们展示了COVID-19如何在世界各地达到大流行然后,我们研究了SARS-CoV-2直系同源物。因为所有频率表 Cell Mol Biol Lett 2011;16(2):264-78.[21] Mei S.概率加权集成转移学习用于预测HIV-1和人类蛋白质之间的相互作用。PloSOne2013;8(11):e79606.[22] Eid F-E,ElHefnawi M,Heath LS. DeNovo:基于病毒宿主序列的蛋白质相互作用预测。Bioinformatics2016;32(8):1144-50.[23] Nourani E,Khunjush F,Sevilgen FE.使用贝叶斯矩阵分解和投影技术预测病毒-人蛋白质-蛋白质相互作用。Biocybern Biomed Eng 2018;38(3):574-85.[24] Basit AH,Abbasi WA,Asif A,Gull S,Minhas FUAA.培养宿主-病原体蛋白质-蛋白质相互作用预测因子。J Bioinf Comput Biol 2018;16(4):1850014。[25] 杨X,杨S,李Q,Wuchty S,张Z.通过基于序列嵌入的机器学习方法预测人类-病毒蛋白质-蛋白质相互作用。Comput Struct BiotechnolJ 2020;18:153-61.B. Khorsand等人医学信息学解锁20(2020)10041310[26] Barman RK,Saha S,Das S.使用监督机器学习方法预测病毒和宿主蛋白质之间的相互作用。PloS One 2014;9(11):e112034.[27] LeiteDMC,BrochetX,ReschG,QueY-A,NevesA,P enpasta-ReyesC. 通过组学数据分析和机器学习计算预测宿主-病原体相互作用。在:生物信息学和生物医学工程国际会议; 2017年。p. 360比71[28] ZahiriJ,Khorsand B,Yousefi A,Kargar M,Zade RSH,MahdevarG.AntAngio
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功