没有合适的资源?快使用搜索试试~ 我知道了~
医学信息学解锁21(2020)100478免疫信息学方法构建新型SARS-CoV-2亚单位疫苗Bishajit Sarkara,b,Md Asad Ullaha, b,Yusha Arafa, c,Mohammad Shahedur Rahmana,b,*aCOVID研究小组(CRC),Wazed Miah科学研究中心(WMSRC),Jahangirnagar大学,Savar,达卡,孟加拉国b孟加拉国达卡萨瓦尔贾汉吉尔纳加尔大学生物科学学院生物技术和遗传工程系c孟加拉国锡尔赫特Shahjalal科技大学生命科学学院遗传工程和生物技术系。A R T I C L EI N FO关键词:COVID-19SARS-CoV-2免疫信息学疫苗设计A B S T R A C T由于最近COVID-19大流行造成的感染和死亡人数每天都在急剧增加,科学家们正急于制定可能的对策来对抗致命的病毒SARS-CoV,2.尽管已经为开发潜在的疫苗做出了许多努力;然而,其中大多数被证明具有负面后果。因此,在本研究中,利用免疫信息学方法设计了针对SARS-CoV-2的新型基于表位的亚单位疫苗,靶向病毒的四个必需蛋白,刺突糖蛋白、核衣壳磷蛋白、膜糖蛋白和包膜蛋白。使用高度抗原性、非过敏性、非毒性、非人同源物和100%保守的(在来自世界不同地区的其他分离株中)表位来构建疫苗。总共使用14个CTL表位和18个HTL表位来构建疫苗。此后,进行了几次计算机模拟验证,即,还进行了分子对接、分子动力学模拟(包括RMSF和RMSD研究)和免疫模拟研究,这些研究预测所设计的疫苗在生物环境中应该是相当安全、有效和稳定的。最后,还进行了电子克隆和密码子适应性研究,以设计有效的疫苗大规模生产策略。然而,需要对预测的疫苗进行更多的体外和体内研究,以最终验证其安全性和有效性。1. 介绍2019年冠状病毒病或COVID-19是由一种称为严重急性呼吸系统综合征冠状病毒- 2(SARS-CoV-2)的病毒引起的。该疾病于2019年12月起源于中国湖北省武汉市。但现在它的传播突然加速在世界范围内从它的起源[1,2]。冠状病毒(Coronaviruses,CoV)是一类具有一些一般特征的非常多样化的RNA病毒,即包膜病毒和正义病毒,含有单链RNA(ssRNA)。它们引起呼吸系统、肝脏、神经系统以及肠道系统的几种全身性表现。 事实上,它们的感染严重程度因物种而异[3,4]。迄今为止,七种人类冠状病毒(HCoV),即, HCoV-OC 43,HCoV-HKU 1,HCoV-229E, HCoV-NL63, SARS冠状病毒, MERS CoV, 和发现SARS-CoV-2可导致轻度至重度呼吸道感染,人类的疾病[5]。但最重要的是,SARS-CoV,MER-S-CoV和SARS-CoV-2,这三种HCoV在过去的几年中出现,两几十年[6、7]。虽然 的 SARS-CoV 和MERS-CoV疫情在全球范围内没有太大影响;然而,最近引起SARS-CoV-2的COVID-19大流行已经造成了许多痛苦,夺去了数百万人的生命,更不用说感染全球数百万人了。截至二零二零年十月二十二日,COVID-19已在全球约217个国家及地区传播。不仅如此,它还结束了1,137,804人的生命,近4100万例感染病例[8]。或许,治疗COVID-19疾病的特定药物的开发和评估将需要几年时间。尽管如此,目前正在研究重新利用广泛的现有宿主导向疗法[9]。现有的治疗药物主要用于治疗SARS-CoV-2感染引起目前,不同类型的抗病毒剂,即,Remdesivir、lopinavir、ritonavir等,抗生素(如阿奇霉素)、神经氨酸酶抑制剂、RNA合成抑制剂和血浆疗法被用于治疗10,11。然而,研究报告说,大多数这些疗法显示出许多不利影响的个人的健康,他们是* 通讯作者。Wazed Miah科学研究中心,贾汉吉尔纳加尔大学,萨瓦尔,达卡,1342,孟加拉国。电子邮件地址:rahmanms@juniv.edu(M.S.Rahman)。https://doi.org/10.1016/j.imu.2020.100478接收日期:2020年9月26日;接收日期:2020年10月30日;接受日期:2020年11月5日2020年11月11日网上发售2352-9148/© 2020作者。出版社:Elsevier Ltd这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。可在ScienceDirect上获得目录列表医学信息学期刊主页:http://www.elsevier.com/locate/imuB. Sarkar等人医学信息学解锁21(2020)1004782测试[11,12]。由于目前的治疗方法只能缓解与感染相关的症状,以减少传播甚至根除这种传染性病毒,因此制定有效的疫苗接种策略已成为必须做的工作[13]。目前,在2020年1月11日病毒基因组测序结果公布并正式发布后,来自众多国家的著名制药和研究机构中至少有40家已经展示了他们对开发COVID-19疫苗的热情[14]。 一些机构已经开始在动物和临床试验中对其潜在候选药物进行疗效评估15,16。同样,最新的基于载体的疫苗LV-SMENP DC的I期临床试验于2020年3月24日进行,共有100名患者参与。但该研究的完成日期估计为2024年12月31日(NCT04276896)[17]。此外,还展示了使用全灭活或减毒活病毒疫苗的常规疫苗接种策略。香港大学的研究人员已经提出了一种表达SARS-CoV-2蛋白的活流感疫苗[18,19]。除此之外,CODAGENI X还开发了“密码子去优化“技术。基本上,这项技术可以减弱病毒,该公司目前正在探索COVID-19疫苗接种策略[20]。然而,衰减的主要缺点是,二次突变可以在疫苗接种期间促进毒力。逆转,并可能导致更严重的情况。与这些疫苗相比,亚单位疫苗的主要优点是它们是使用安全,因为这种疫苗的成分仅仅是来自任何目标感染性病原体的重组蛋白或合成肽。这些疫苗不包括整个感染因子。因此,当涉及亚单位疫苗时,给药后诱导任何不良反应的概率较小[21]。这种类型的疫苗对于对抗像SARS-CoV-2这样的高传染性和致病性病毒更为重要。目前,正在研究开发针对其他冠状病毒(如SARS-CoV、MERS-CoV等)的潜在亚单位疫苗。如果针对SARS-CoV-2开发了减毒或全灭活型疫苗,则由于其高突变率和感染性,减毒病毒可能会恢复其毒力形式[22,23]。因此,在对人类健康的不良影响相对较小的情况下,科学家应该优先开发针对SARS-CoV-2的亚单位疫苗在 这 学习, 有效亚基 疫苗是针对来自世界各地不同国家的SARS-CoV-2的各种分离株,利用免疫信息学方法。在免疫信息学中,病原体或病毒的新抗原通过解剖其基因组数据来鉴定,然后通过分析其基因组将不同的计算机生物学工具用于疫苗开发[24本研究设计了一种基于表位的疫苗蓝图,该疫苗可能针对来自世界各地的SARS-CoV-2分离株产生实质性的免疫应答,靶向刺突糖蛋白,核衣壳 磷蛋白, 膜 糖蛋白和图1.一、疫苗设计研究采用分步程序。B. Sarkar等人医学信息学解锁21(2020)1004783图二. 以顺序和适当方式具有接头(EAAAK、AAY和GPGPG)、PADRE序列、佐剂(人β-防御素-3)和表位(CTL-1、CTL-2、CTL-3以及HTL-1、HTL-2、HTL-3等)的病毒进入宿主细胞,这些蛋白质是抗体的主要目标。核衣壳磷蛋白是将病毒基因组包装成螺旋状核糖核衣壳(RNP)的关键,在病毒自组装过程中起着基础性作用。此外,膜和包膜蛋白对于病毒进入、复制、出芽和宿主细胞内的颗粒组装是重要的12、27。因此,这四种蛋白质被用作本研究中的潜在靶点,以设计疫苗,目的是干扰病毒的生命周期。图1表示本研究中用于设计疫苗的分步程序。2. 材料和方法2.1. 菌株鉴定和蛋白质序列检索对从孟加拉国分离到的SARS-CoV-2病毒进行了鉴定,并对该病毒的4个靶蛋白进行了初步分析。刺突糖蛋白,核衣壳图三. CV疫苗的三级结构。病毒的包膜蛋白。以从孟加拉国分离的SARS-CoV-2的蛋白质序列为模型构建疫苗。只有那些在其他一些选定的国家被发现是100%保守的表位被用于疫苗构建。因此,设计的疫苗也有望在全球不同地区有效。SARS-CoV-2的刺突糖蛋白促进和促进了从国家生物技术信息中心或NCBI(https://www.ncbi.nlm.nih.gov/)数据库检索磷蛋白、膜糖蛋白和包膜蛋白。2.2. 蛋白质的抗原性预测及理化性质分析通过在线工具VaxiJen v2.0(http://www.ddg-ph)预测SARS-CoV-2蛋白质序列的抗原性见图4。TLR-8(左侧可变颜色的受体蛋白)和CV疫苗(右侧黄色的配体蛋白)之间的相互作用。其中相互作 用的氨 基酸 对是: Leu 342( 受体) - Glu 340(配体),Ala 99(受体)Ala 97(受体)-Ile 496(配体),Phe 486(受体)-tor)- Leu 372(配体),Leu 342(受体)- Val 488(配体),Leu 535(受体)-Phe 526(配体),Tyr563(受体)-Asp 543(配体),Lys 333(受体)-Asp 543 ( 配 体 ) , Ile 409 ( 受 体 ) - Leu 514 ( 配体),Lys 412(受体)- Leu 515(配体),Leu 433(受体)- Ile 496(配体). (For对本图中颜色图例的解释,读者可参考本文的网络版。)B. Sarkar等人医学信息学解锁21(2020)1004784图五. CV-TLR-8复合物的MD模拟结果以及疫苗的唯一晶体结构。这里,(a)复合物骨架的RMSD图显示复合物结构保持稳定结构,波动最小。(b)复合物中所有原子在其平均位置的RMS波动。图中的峰和谷表示分子结构中相应区域的柔性(c)蛋白质复合物的回转半径(d)晶体结构骨架的RMSD图显示结构保持稳定结构,波动最小。(e)RMS晶体结构中所有原子在其平均位置上的涨落。(f)结晶疫苗结构的回转半径armfac.net/vaxijen/VaxiJen/VaxiJen.html),使用0.4的预测准确度阈值,因为0.4阈值已被证明增加预测准确度[28]。该服务器的算法使用了一种无约束的方法来确定查询肽或蛋白质的抗原性,该方法完全基于自互协方差(ACC)转换方法。在该方法中,查询肽或蛋白质的一般ACC计算仅基于其物理化学性质进行[28此后,通过E x PASy的在线工具ProtParam(www.example.com)预测所选抗原蛋白序列的各种物理化学性质https://web.expasy。org/protparam/),其中所有参数也保持为默认值[31]。2.3. T细胞表位有效的多表位亚单位疫苗必须包含细胞-淋巴细胞(CTL)和辅助性T淋巴细胞(HTL)表位,使得在施用后,疫苗将能够刺激免疫应答。免疫细胞,并产生大量的免疫反应[32,33]。使用在线表位预测服务器NetCTL 1.2(http://www.cbs.dtu.dk/services/NetCTL/)预测所选蛋白质序列的MHC I类或CTL表位[34]。该服务器使用NetCTL 1.2统计方法从给定的查询蛋白质序列中预测可能的表位。该统计方法考虑了蛋白酶体切割的概率、TAP(与抗原加工相关的转运蛋白)转运效率和MHC I类结合,同时提供了相当特异和灵敏的预测。当通过受试者操作特征(ROC)方法分析时,该方法产生比EpiJen、WAPP和许多其他表位预测方法更好的结果[34]。使用另一在线表位预测服务器,免疫表位数据库或IEDB(https://www.iedb.org/)预测MHC II类表位。IEDB服务器保存了大量关于抗体和T细胞表位的数据,这些数据在人类、非人灵长类动物和其他动物物种中进行了感染性疾病、过敏、自身免疫和移植方面的实验[35,36]。获得了MHC-II类限制性CD 4+HTL表位。B. Sarkar等人医学信息学解锁21(2020)1004785=见图6。C-IMMSIMM表示的免疫模拟的最佳预测疫苗,CV。(a)免疫球蛋白和免疫复合物对CV疫苗接种的应答(黑色线)和特定亚类由彩色线表示,(b)在三次注射过程中B细胞群的增加,(c)在接种过程中每个状态的B细胞群的增加,(d)在注射过程中血浆B细胞群的增加,(e)在三次注射过程中辅助性T细胞群体的增强,(f)在疫苗接种过程中每个状态的辅助性T细胞群体的增加,(g)在三次注射过程中调节性T淋巴细胞的升高,(h)在注射过程中细胞毒性T淋巴细胞群体的增加,(i)在三次注射过程中每个状态的活性细胞毒性T淋巴细胞群体的增加,(j)在三次注射过程中每个状态的活性树突细胞群体的上升,(k)在注射过程中每个状态的巨噬细胞群体的增加,(l)在 三次 注 射 过程 中 不同类型的细胞因子的浓 度的增加。完整的HLA集,使用IEDB推荐的2.22预测方法[36,37]。取被发现对于所有选择的参考HLA等位基因共同的最高MHC I类和MHC II类表位用于进一步分析。2.4. 抗原性、变应原性、毒性和跨膜拓扑结构测定在这项研究中,设定了一些标准,从NetCTL 1.2和IEDB服务器预测的所有表位中选择最有希望的表位。只有那些被发现是高度抗原性的、非过敏性的、非毒性的、100%保守的(在来自世界各地不同国家的所选序列中)和与人蛋白质组非同源的表位被认为是最有希望的或最佳选择的表位,并且只有这些表位被用于疫苗构建过程。所选表位的抗原性为再次使用VaxiJenv2.0(www.example.com/VaxiJen/VaxiJen.htmlhttp://www.ddg-pharmfac.net/vax 此 后 , 使 用 两 种 不 同 的 在 线 工 具 AllerTOP v2.0(https://www.ddg-pharmfac.net/AllerTOP/)和AllergenFP v1.0(http://ddg-pharmfac.net/AllergenFP/),以获得更好的预测准确性。然而,AllerTOP v2.0生成的结果优先考虑,因为该服务器的预测准确率为88.7%,优于AllergenFP服务器(87.9%)[38,39]。这两个服务器都使用ACC转换方法来生成它们的预测,然而,AllerTop 2.0服务器通过k-最近邻算法(kNN,k1)另一方面,AllergenFP服务器使用Tanimoto系数,以确定查询蛋白的变应原性或非变应原性。这两个服务器都是通过机器学习方法开发的,基于包含2427种已知过敏原和2427种已知非过敏原的训练集。B. Sarkar等人医学信息学解锁21(2020)1004786[38、39]。见图6。 (续)。表位与来自以下的靶蛋白的序列比对(MSA):之后,使用ToX inPred服务器(http://crdd.osdd.net/raghava/toXinpred/)进行表位的遗传性预测[40]。与本研究中使用的许多在线工具一样,该服务器基于机器学习技术进行预测,该技术是通过使用包含1805个序列的阳性训练数据集和两个阴性数据集开发的:一个集包含来自Swissprot的3593个阴性序列,另一个集包含来自TrEMBLE的12,541个阴性序列。一些独立的数据集也经常被服务器使用.在预测过程中,采用了支持向量机(SVM)方法,所有参数均保持默认值。当通过马修相关系数(MCC)进行评估时,SVM方法在准确性方面表现出优异的性能[ 40 ]。最后,使用蛋白质螺旋决定簇的跨膜拓扑结构,TMHMM v2.0服务器(http://www.cbs.dtu.dk/services/TMHMM/)确定所选表位的跨膜拓扑结构[41]。2.5. 表位的保守性和人类同源性预测使用IEDB服务器(http://www.example.com)的“表位保守性分析”模块进行所选表位的保守性分析www.iedb.org/conservancy/为了进一步确认IEDB服务器的保护性分析生成的结果,在不同的国家,由ClustalX 2.1工具进行[43]。该工具在单个模块中编译了不同的统计方法,可用于生成目标肽或蛋白质的MSA图谱。在来自世界各地不同国家的SARS-CoV-2的所选分离株中发现100%保守的表位被考虑用于疫苗构建(连同一些提到的标准),因为这将确保所设计的疫苗对所选分离株的效力。此后,确定表位与人蛋白质组的同源性以找出与人蛋白质组具有同源性的任何表位。仅考虑非同源表位以预防任何类型的自身免疫反应[44]; Adianingsih 和Kharisma,2019)。BLAST(https://blast.ncbi.nlm.nih.gov/Blast.cgi)工具的蛋白质基本局部比对搜索工具(BLAST)模块(blastP)用于人同源性测定,其中智人(Homo sapiens)(taxid:9606)用作比较生物体,保持所有其他参数默认。在实验中将e值截止值设定为0.05,并且选择没有命中低于e值包含阈值的表位作为非同源肽[45]。B. Sarkar等人医学信息学解锁21(2020)1004787+见图7。构建具有CV疫苗插入物的pETite载体质粒(以红色标记)。(For对本图中颜色图例的解释,读者可参考本文的网络版2.6. 表位的细胞因子诱导能力预测辅助T细胞产生几种类型的细胞因子,包括IFN-γ(干扰素-γ)、IL-4(白细胞介素-4)和IL-10(白细胞介素-10),以激活和刺激不同类型的免疫细胞,即细胞-免疫T细胞、巨噬细胞、B细胞等[46]。因此,预测HTL或MHC II类抗原表位的细胞因子诱导能力是疫苗构建的重要标准。使用IFNepi-tope(http://crdd.osdd.net/raghava/ifnepitope/)服务器确定预测的HTL表位的IFN-γ诱导能力。混合(Motif SVM)预测方法用于确定IFN-γ诱导能力,其是用于预测表位的IFN-γ诱导能力的高度准确的方法之一。此外,分别使用IL4pred( https://webs.iiitd.edu.in/raghava/il4pred/index.php ) 和 IL 10 pred(http://crdd.osdd.net/raghava/IL-10 pred/)服 务器 47在IL4pred和IL10pred预测中使用SVM方法,将阈值保持在默认值。2.7. 人口覆盖率分析为了设计多表位疫苗,考虑特定HLA等位基因在世界各地不同人群和种族中的分布是至关重要的先决条件,因为不同的HLA等位基因可以从一个群体到另一个群体而变化。 IEDB人群覆盖率工具(http://tools.iedb.org/population/)用于确定全球不同地区不同HLA等位基因中最有希望的表位的人群覆盖率[42]。2.8. MHC等位基因进行MHC等位基因的聚类分析,以确定研究中使用的MHC I类和II类等 位 基 因 的 关 系 。 使 用 在 线 工 具 MHCcluster2.0(http://www.cbs.dtu.dk/services/MHCcluster/)进行MHC等位基因的聚类分析[50]。在分析过程中,服务器的所有参数保持默认,并选择所有使用的HLA超型代表(MHC I类)和HLA-DR代表(MHC II类)。2.9. 疫苗构建在该步骤中,将来自2.4亚段的最有希望的表位彼此缀合以构建可能的疫苗。作为佐剂序列的人β-防御素-3通过EAAAK接头连接至表位。佐剂对于增强构建的疫苗的抗原性和免疫原性是重要的[51,52]。panHLA-DR表位(PADRE)序列也与相邻表位相关。PADRE序列激发免疫反应B. Sarkar等人表1医学信息学解锁21(2020)1004788所选病毒蛋白的抗原性和理化性质分析。AN;抗原性,pI;等电点,II;不稳定性指数,AI;脂肪族指数,GRAVY;亲水性总平均值。残基系数核壳磷蛋白膜糖蛋白网织红细胞,>20小时(酵母,>10 h(大肠杆菌抗原10.09 36 61 43,890 30 h(哺乳动物网织红细胞,>20小时(酵母,>10 h(大肠杆菌抗原9.51 13 21 52,160 30 h(哺乳动物网织红细胞,>20小时(酵母,>10 h(大肠杆菌(32.86)不稳定(55.81)稳定(39.14)52.53-0.980120.86-0.446包膜蛋白抗原8.57 3 5 6085 30 h(哺乳动物网织红细胞,>20小时(酵母,>10 h(大肠杆菌稳定(38.68)144.00-0.827表2最终选择用于疫苗构建的表位列表(选择标准:抗原性、非过敏性、非毒性、100%保守性和与人蛋白质组非同源性蛋白质名称MHC class-I epitopes MHC class-II epitopes刺突糖蛋白VLPFNDGVY QSLLIVNNATNVVIKWTAGAAAYY VLSFELLHAPATVCGGAAAYYVGY VVLSFELLHAPATVCQLTPTWRVYSTECSNLLLVLKGVKLHY核衣壳磷蛋白SSPDQIGY IAQFAPSASAFFGMSSPDDQIGYY GTRNPANNAAIVLQLDLSPRWYFYLSPRWYFYY膜糖蛋白LVGLMWLSY IKLIFLWLLWPVTLAATSRTLSYY VGLMWLSYFIASFRLAGDSGFAAY KLIFLWLLWPVTLAC包膜蛋白VSLVKPSFY LLFLAFVVFLLVTLA–VLLFLAFVVFLL–LFLAFVVFLLVTLAI–AFVVFLLVTLAILTA–VNSVLLFLAFVVFLL–NSVLLFLAFVVFLLV–SVLLFLAFVVFLLVT–FLLVTLAILTALRLC–FLAFVVFLLVTLAIL–LAFVVFLLVTLAILT通过提高疫苗的CTL表位的能力[53,54]。此后,AAY和GPGPG接头用于缀合CTL和HTL表位。EAAAK接头被证明提供双功能融合蛋白的结构域的分区[55],而GPGPG接头用于产生连接表位,并且还用于增强免疫加工和呈递[56]。AAY接头也广泛应用于计算机疫苗设计实验中,因为该接头有效且高效地缀合表位。 图 2表3代表了本研究中疫苗设计的图解说明。2.10. 抗原性、变应原性和理化性质分析通 过在 线服 务器 VaxiJenv2.0 (http://www.ddg-pharmfac.net/vaxijen/VaxiJen/VaxiJen.html)预测构建疫苗的抗原性,将预测阈值设定为0.4 [28]。针对SARS-CoV-2构建的疫苗粗体字母表示接头序列。疫苗名称疫苗构建体“CV”GPGIKLIFLWLLWPVTLAGPGPGVGLMWLSYFIASFRLGPGPGKLIFLWLLWPVTLACPGPGLLFLAFVVFLLVTLAGPGPGVLLFLAFVVFLLVTLGPGPGPGLFLAFVVFLLVTLAIGPGPGVNSVLLFLAFVVFLLGPGPGNSVLLFLAFVFLLVGPGPGPGSVLLFLAFVFLLVTGPGPGPGFLLVTLAILTALRLCGPGPGFLAFVVLLVTLAILGPGPGPGPGPGPGLAFVVLLVTLAILTGPGPPG蛋白质名称一个Pi带负电荷残基总数带正电的总数EX t。半衰期IIAI肉汁刺突糖蛋白抗原6.32109103148,96030 h(哺乳动物稳定84.67-0.077B. Sarkar等人医学信息学解锁21(2020)1004789===--- + ±±表4疫苗构建体的抗原性、致敏性和理化性质分析。AN;抗原性,AG;变应原性,pI;等电点,II;不稳定性指数,AI;脂肪族指数,GRAVY;亲水性总平均值。带电系数过敏性网织红细胞,20分钟(32.45)(SolPro:(酵母,>10 h0.760,(大肠杆菌蛋白溶胶:0.668)表5CV疫苗与TLR-8相互作用的分子对接研究结果分子力学-广义玻恩表面积。目标TLR(含PDB ID)Pro能量评分(最低能量,单位为kcal mol-1)全球能源(PatchDock服务器)HawkDock评分(最低分)MM-GBSA(结合自由能,kcal mol-1)TLR-1(6NIH)-1131.7-8.30-5701.54-43.28TLR-2(3A7C)-1021.3-24.33-4102.30-66.69TLR-3(2A0Z)-923.5-11.73-3708.21-49.22TLR-4(4G8A)-955.1-2.92-5568.56-65.08TLR-8(3W3M)-1261.2-32.29-5819.85-112.41TLR-9(4QDH)-1139.0-6.02-3988.37-109.86此 后 , 使 用 AlgPred ( http://crdd.osdd.net/raghava/algpred/ ) 和AllerTop v2.0(https://www.ddg-pharmfac.net/AllerTOP/)服务器来确定疫苗构建体57的变应原性。通过AlgPred服务器,使用多个E表达基序的基序激发(MEME)/基序比对&该服务器也是基于机器学习技术开发的,使用蛋白质数据集进行训练。服务器的算法已经通过将蛋白质聚类到五个不同的训练集中来训练,并且该聚类是基于使用BLAST的相似性矩 阵 来 完 成 的 [58] 。 之 后 , 通 过 在 线 服 务 器 ProtParam( https://web.expasy.org/protparam/ ) 分 析 疫 苗 的 各 种 理 化 性 质[31]。最后,通过SCRATCH蛋白预测器(http://scratch.proteomics.ics.uci.edu/)的SOLpro模块确定疫苗构建体 的 溶 解 度 , 并 通 过 Protein-sol 服 务 器 ( https://protein-sol.manchester.ac.uk/)进一步澄清。这两个服务器都使用机器学习技术来提供更可靠的预测。在预测过程中,所有参数都保持在默认值[59,60]。2.11. 疫苗构建体的二级和三级结构预测在对疫苗进行理化性质分析后,对其进行二级结构预测。一些在线工具,例如,PRISPRED(http://bioinf.cs.ucl.ac.uk/psipred/)(使用PRISPRED 4.0预测方法)、GOR IV(https://npsa-prabi.ibcp.fr/cgibin/npsa_automat.pl?页面/NPSA/npsa_gor4.html),SOPMA(https://npsa-prabi.ibcp.fr/cgibin/npsa_automat.pl?页面 /NPSA/npsa_sopma.html)和SIMPA 96(https://npsaprabi.ibcp.fr/cgi-bin/npsa_automat.pl?页面/NPSA/npsa_simpa96.html)用于运行预测,保持所有参数默认[61,62]。之后,使用RaptorX(www.example.com)预测疫苗的三级或3D结构http://raptorx.uchicago。edu/)online server.服务器使用有效的基于模板的方法预测蛋白质的三级或3D结构[63]。2.12. 3D结构细化和验证通过计算方法生成的3D结构可能无法提供蛋白质的真实或天然结构。因此,进行3D结构细化以增强计算预测模型的分辨率,使得它们可以非常类似于天然蛋白质结构。通过GalaxyWEB的GalaxyRefine模块对所设计疫苗的生成3D结构进行了优化。服务器(http://galaxy.seoklab.org/),其使用CASP10测试的精炼方法进行蛋白质结构精炼[64,65]。 在改进结构后,通过分析由PROSA-web (https:servicesn.mbi.ucla.edu/PROCHECK/ )服务器[66 , 67] 生 成 的 Ramachandran 图 和 由 另 一 在 线 工 具 ProSA-web(www.example.com)提供的z 分数https://prosa.services.came。sbg.ac.at/prosa.php)。PDB数据库中所有实验测定的蛋白质链的z分数范围内的z分数对应于查询蛋白质的较高质量[68]。2.13. 疫苗蛋白二硫键工程通过在线工具Disulfide by Design 2 v12.2(www.example.com)进行疫苗蛋白二硫化物工程化http://cptweb.cpt.wayne。[69]。服务器确定蛋白质结构中最有可能形成二硫键的可能位点。在预测过程中,选择了甘氨酸残基的链内、链间和Cβχ3和CαCβ-Sγ角保持在小行星8797 ◦5和114.6磅10,分别和氨基酸对选择键能小于2.2kcal/mol的突变体突变为半胱氨酸残基,以在它们之间形成二硫键。本研究中使用2.2 kcal/mol作为阈值,因为几乎90%天然形成的二硫键的能量值小于2.2 kcal/mol [69,70]。2.14. 蛋白质对接在蛋白质-蛋白质对接中,疫苗构建体针对多个TLR对接。对于疫苗来说,与TLR具有良好的结合亲和力是非常重要的,因为TLR蛋白在识别模拟原始病毒感染的疫苗后产生潜在的免疫应答。因此,它们有助于产生对特定病毒或病原体的强免疫力[71]。在这项研究中,与TLR对接,即TLR-1(PDB ID:6NIH)、TLR-2(PDB ID:3A7C)、TLR-3(PDB ID:2A0Z)、TLR-4(PDB ID:4G8A)、TLR-8(PDB ID:3W3M),和TLR9(PDB ID:4QDH)。使用三种不同的在线工具进行蛋白质-蛋白质 对 接 , 以 提 高 预 测 精 度 。 最 初 , 使 用 PADAPPro v2.0(https://cluspro.bu.edu/login.php)进行对接,其中较低的能量分数对应于较好的结合亲和力[72RISK Pro v2.0服务器的算法根据以下公式计算能量分数E= 0.40Erep+(-0.40Eatt) +600Erep +1.00EDARS [72,73]蛋白质名称一个AGpI带负电荷残基的总数总数残基EX t。半衰期IIAI GRAVY溶解度CV抗原非-9.24 1430117,7451 h(哺乳动物稳定113.03 - 0.843可溶性B. Sarkar等人医学信息学解锁21(2020)10047810=-然后使用PatchDock(https://bioinfo3d.cs.tau.ac.il/PatchDock/php.php)服务器再次进行对接,并通过FireDock服务器(http://bioinfo3d.cs.tau.ac.il/FireDock/php。php)。PatchDock服务器的算法受到人工智能中使用的对象识别和图像分割技术的当进行对接分析时,该算法遵循三个主要阶段:分子形状表示、表面补丁匹配以及过滤和评分[76FireDock服务器主要用于通过灵活的细化来消除与蛋白质-蛋白质对接解决方案相关的问题该服务器基于快速刚体对接算法,该算法根据能量函数在非常短的时间内(大约每个候选溶液3.5 s此后,最后一轮对接,由HawkDock服务器(http://cadd.zju.edu.cn/hawkdock/)执行) 以 及 分 子 力 学 - 广 义 玻 恩 表 面 积 ( MM-GBSA ) 研 究 [79] 。HawkDock服务器采用ATTRACT算法的刚体对接协议,该算法预测蛋白质相互作用(PPI)网络中蛋白质的不同结合姿势。然后,服务器的评分功能在ATTRACT评分的帮助下识别蛋白质的近天然结合姿势同样,服务器的MM-GBSA分析还允许用户分析PPI中的关键残基,并重 新 排 序 顶 部 停 靠 模 型 以 进 行 可 靠 预 测 [79 , 80] 。 然 后 使 用Discovery Studio Visualizer[81]可视化与TLR对接的疫苗(具有最高结合亲和力)。2.15. 构象B细胞表位预测体液免疫和细胞免疫对机体内的病原体起着重要的作用。身体的体液免疫取决于B细胞,当它们遇到抗原时产生抗体。因此,构建的疫苗应具有有效的构象B细胞表位,以提供更强的免疫力。通过IEDBElliPro工具(http://tools.iedb.org/ellipro/)预测构建的疫苗蛋白的构象B细胞表位,保持所有参数默认[82]。2.16. 分子动力学模拟为了观察疫苗蛋白的状态变化和环境对疫苗蛋白结晶结构以及蛋白-TLR复合物结构的影响,进行了分子动力学模拟。格罗马克一家使用XmGrace和QtGrace工具分析了图表。最后,对两种模拟方法进行了比较。2.17. 免疫模拟使用C-ImmSim服务器(http://150.146.2.1/CIMMSIM/index.php)对构建的疫苗进行免疫模拟研究以预测其免疫原性和免疫应答谱服务器通过机器学习技术和位置特异性评分矩阵(PSSM)预测类似现实生活的免疫相互作用[83]。在实验期间,除时间步长外的所有参数均保持在其然而,时间步长保持在1、84和170,并且模拟步长的数目被设置为1050。因此,三次注射需要间隔四周,因为大多数商业疫苗的两剂之间的推荐间隔被证明是四周[84]。辛普森多 样 性 指 数 D 是 根 据 这 些 数 字 计算 的 。2.18. 密码子适应和计算机克隆密码子改造和电子克隆是利用免疫信息学设计疫苗的两个重要步骤。在不同的生物体中,一种氨基酸可以被一个以上的密码子编码,因为一种生物体的细胞机制可以与另一种生物体完全不同,这种现象被称为密码子偏好。因此,进行密码子适应以预测在特定生物体中有效编码特定氨基酸的合适密码子。在密码子适应研究中,将疫苗蛋白反向翻译为预期编码设计的疫苗蛋白的氨基酸的可能的DNA序列84,85。Java密码子适应工具或JCat服务器(http://www.jcat.de/)用于构建疫苗的密码子适应研究[86]。在服务器中,原核生物E.以大肠杆菌K12为靶菌,避开了rho非依赖性转录终止子、原核核糖体结合位点、限制性内切酶的EaeI和StyI切割位点。最后,使用SnapGene限制性克隆软件将新适配的DNA序列插入pETite载体的EaeI(位置:第172至177个碱基对)和StyI(位置:第206至211个碱基对)限制性位点之间[87]。pETite载体质粒含有泛素样修饰剂或SUMO标签和6X-His标签,其有助于重组蛋白的溶解和可行的亲和纯化[88]。(GROningen MAchine for Chemical Simulations)一个基于LinuX命令行程序已用于此目的。对结晶和复杂的蛋白质结构进行了两次单独的模拟。为了进行这两个模拟,首先清理结晶化的和复杂的蛋白质之后,使用OPLS-AA(液体模拟优化势-所有原子)力场运行pdb 2gmX,以生成两种结构的拓扑结构。这些结构位于2nm大小的立方体的中心,在它们的模拟期间距离每个边缘1nm。溶剂化通过用空间上以1000 kJ的力常数放置的水分子mol-1 nm-2.然后进行能量最小化,稳定结构。从补充图S1中,我们可以看到,结构的势能已迅速降低到106以下 蛋白质复合体的 由此,我们推断,系统足够稳定,可以进行进一步的模拟。NVT(数值体积温度)平衡已经进行了100 ps以稳定温度。然后,NPT(数压温度)平衡进行100ps,并计算压力和密度。结晶的蛋白质结构也以相同的方式制备。然后对得到的稳定化结构进行了20 ns的MD模拟,预测了能量最小化结构
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功