没有合适的资源?快使用搜索试试~ 我知道了~
免疫信息学与分子模拟设计SARS-CoV-2多表位疫苗
医学信息学解锁24(2021)100578基于免疫信息学和分子模拟的SARS-CoV-2多表位疫苗设计马里兰州 达辛汗a,b,*,马里兰州 Jahirul Islam a,Arpana Parihar a,c,Rahatul Islam b,Tarhima Jahan Jerin d,Rupali Dhote a,c,Md. 阿卡斯·阿里,法里哈·汗·劳拉,Mohammad A. Halima,ea孟加拉国达卡Tejgaon Tejkunipara 16号BICCB红绿研究中心传染病科,邮编1215bShahjalal科技大学遗传工程和生物技术系,锡尔赫特,3114,孟加拉国cBarkatullah大学遗传学系,Bhopal,Madhya Pradesh,462026,印度d孟加拉国坦盖尔Mawlana Bhashani科技大学生物技术和遗传工程系,1902年美国阿肯色州史密斯堡阿肯色大学物理科学系A R T I C L EI N FO关键词:免疫信息学SARS-CoV-1多表位疫苗SARS-CoV-2分子动力学模拟A B S T R A C T严重急性呼吸综合征冠状病毒2型(SARS-CoV-2)是一种高度传染性和致病性的人类冠状病毒,引起了急性呼吸综合征(COVID-19)的大流行,对全球卫生安全构成了重大威胁。本研究的目的是计算设计一种有效的基于多肽的多表位疫苗(MEV),以抗SARS-CoV-2。已对候选疫苗的总体模型质量、免疫原性、过敏原性和理化分析进行了验证。分子动力学研究证实了候选疫苗的稳定性。模拟过程中对接的复合物显示MEV与人和小鼠Toll样受体(TLR)、TLR 3和TLR 4具有强而稳定的结合相互作用。最后,候选疫苗密码子已经被优化用于它们在E.coli表达系统,以确认增加的表达。MEV是一种潜在的抗SARS-CoV-2的候选疫苗,但其安全性和免疫原性尚需实验验证1. 介绍世界卫生组织(WHO)于2020年3月11日宣布最近的新型冠状病毒(SARS-CoV-2)爆发为大流行病。这场疫情不仅影响了全球数百万人,给社会带来了严重的健康负担,还导致全球经济极度失衡。SARS-CoV-2 属于β冠状病 毒家族, 与严重急性呼 吸综合征病 毒(SARS-CoV)和中东呼吸综合征病毒(MERS-CoV)密切相关,这两种病毒分别导致2002年和2012年的爆发[1,2]。SARS-CoV-2是一种小病毒,其基因组为正义单链RNA,全长约30Kb,编码9860个氨基酸。基因组主要被翻译成三种类型的蛋白质:1)非结构蛋白(ORFla/b、nsp 2、nsp 3、nsp 4、nsp 9),2)辅助蛋白(ORF 3a、ORF 8、ORF 7a/b),和3)结构蛋白,包括刺突蛋白、包膜蛋白、膜蛋白和核衣壳蛋白[3,4]。在在这方面,最近一项关于SARS-CoV-2人类蛋白质相互作用图谱的研究表明,几种SARS-CoV-2和人类蛋白质受体可作为推定的治疗靶点[2]。非结构蛋白质包括病毒酶和其他辅助蛋白质,其有助于基因组复制和发病。结构蛋白在病毒致病、复制和感染传播中起关键作用。基本上,刺突蛋白与人ACE2受体的相互作用导致病毒在宿主细胞内的内化,其中病毒基因组被复制并与核衣壳蛋白相互作用。病毒复制后,囊膜蛋白和外膜蛋白帮助子代病毒粒子[3目前尚无治疗COVID-19疾病的特效药物或疫苗。辉瑞/BioNTech疫苗在预防COVID-19感染方面有95%的有效性[7],但其批准状态在全球范围内各不相同。在疫苗尚未获得相关监管机构批准的国家,它是一种研究药物,其安全性和有效性尚未确定[8]。最有前途的* 通讯作者。传染病科,红绿研究中心,BICCB,16 Tejkunipara,Tejgaon,Dhaka,1215,Bangladesh。电子邮件地址:tahsinkhan570@gmail.com(马里兰州)Khan)。https://doi.org/10.1016/j.imu.2021.100578接收日期:2020年12月20日;接收日期:2021年4月12日;接受日期:2021年4月13日2021年4月21日在线提供2352-9148/© 2021作者。出版社:Elsevier Ltd这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。可在ScienceDirect上获得目录列表医学信息学期刊主页:http://www.elsevier.com/locate/imu医学博士 Khan等人医学信息学解锁24(2021)1005782应对任何大流行病的方法是接种疫苗;然而,疫苗的开发是一个具有挑战性的过程。从早期SARS和MERS爆发中吸取的经验教训以及技术进步加快了疫苗的开发进程。到目前为止,许多候选疫苗要么进入了临床试验或准备通过履行初步评估协议开始试验过程。例如,Moderna的基于mRNA-1273的疫苗进入1/2期试验,Inovio制药公司命名为INO-4800的DNA疫苗,微针阵列递送的重组冠状病毒疫苗等都显示出有希望的结果[ 9 ]。最针对SARS-CoV-2的疫苗开发的重要策略是灭活或弱化病毒、基于复制或非复制病毒载体的方法、DNA、RNA、病毒颗粒样方法和基于蛋白质亚基的方法,后者包括免疫信息学方法[10]。其中,免疫信息学和反向疫苗组学方法快速、准确、具有成本效益且对病原体可靠[11]。在这方面,Ruth Arnon关于针对流感(H5N1)病毒的基于表位的疫苗的开创性工作证明了免疫信息学方法的可靠性[11,12]。几个研究小组也报道了设计抗SARS-CoV-2亚单位疫苗的免疫信息学方法,然而,其中只有两个处于临床前试验[13]。几项研究提出了通过免疫信息学方法加速安全疫苗开发的亚单位疫苗,但它们仅限于单一蛋白[14,15]或SARS-CoV-2的极少数蛋白[16,17]。本研究的目的是设计一种多表位的SARS-CoV- 2疫苗,有效地激发宿主的先天性和适应性免疫反应,从而提供最大的保护。因此,根据SARS-CoV-2的21种结构和非结构蛋白(刺突蛋白、核衣壳蛋白、膜蛋白、包膜蛋白、内切RNA酶、nsp 4、nsp 9、nsp 6、ORF 3a、ORF 6、ORF 7a、ORF 8和ORF 10)中的13种蛋白的抗原性评分来选择它们。分析这些蛋白用于预测细胞毒性T细胞(CTL)、辅助T细胞(HTL)和B细胞表位。在人群覆盖率研究中检查表位的毒性、变应原性和保守性。将佐剂、最有希望的CTL、HTL和B细胞表位与合适的接头组合,构建疫苗。对疫苗结构进行建模并针对TLR3和TLR4进行对接,以确保其诱导免疫应答的功效。此外,对接复合物进行了验证和分析,使用分子动力学模拟。最后,为了确保疫苗的表达和翻译效率,进行电子克隆。我们的研究与其他现有报道的肽疫苗相比的独特之处在于,所选择的表位能够在人和小鼠中引发免疫应答,这在疫苗构建体的体内功效测试过程中的成本降低方面是有益的2. 方法本研究中使用的生物信息学资源见补充表S1。2.1. 蛋白选择SARS冠状病毒2型的参考蛋白来自美国国家生物技术信息中心(NCBI)。 利用VaxiJen v2服务器筛选出高抗原性蛋白质,临界值>0.45。我们选择了FASTA格式的21种蛋白质,包括nsp2(YP_009725298.1)、nsp4(YP_009725300.1)、3C样蛋白酶( YP_009725301.1 ) 、 nsp6 ( YP_009725302.1 ) 、 nsp7(YP_009725303.1)、nsp8(YP_009725304.1),NSP9(YP_009725305.1),NSP10(YP 1 ) 、 内 切 RNA 酶 ( YP_009725307.1 ) 、 解 旋 酶( YP_009725308.1 ) 、 刺 突 ( YP_009724390.1 ) 、 包 膜( YP_009724392.1 ) 、 核 衣 壳 ( YP_009724397.2 ) 、 ORF3a(YP_009724391.1)、ORF6(YP_009724394.1)、ORF7a(YP_009724395.1),ORF8(YP_009724396.1),领导人蛋白(YP_009725297.1)、3′至5′外切核酸酶(YP_009725309.1)和2′-O-核糖甲基转移酶(YP_009725311.1)。选择显示抗原评分高于阈值的蛋白质用于表位筛选。2.2. MHC I类(CD8+ T细胞)表位筛选通过NetCTL 1.2服务器用默认参数(阈值-0.75; C末端切割的重量0.15和TAP转运效率上的权重:0.05)来预测针对HLA I类等位基因的12个人超家族(A1、A2、A3、A24、A26、B7、B8、B27、B39、B44、B58、B62)的9-mer CTL表位。选择表位长度为9 mer,因为NetCTL 1.2服务器已经在一组886个已知的9 mer MHC I类配体上训练,而服务器的平均AUC得分(ROC曲线下面积)为0.941。通过1)TMHMM服务器预测拓扑结构,2)VaxiJen v2.0服务器预测抗原评分,3)AllerTOP v.2.0服务器预测变应原性,和4)ToX inPred服务器预测x性,筛选与人超型显示良好结合亲和力的表位。通过拓扑学外、抗原性、非过敏原和非毒性筛选的表位通过NetMHC4服务器进行小鼠等位基因(H-2-Db、H-2-Dd、H-2-K b、H-2-Kd、H-2-Kk和H-2-Ld)结合。表位显示阳性结果的进一步与IEDB I类免疫原性服务器进行人HLA I类结合的交叉检查。最后,选择大多数HLA覆盖表位作为最终表位,并进行群体覆盖率分析。2.3. MHC II类(CD4+ T细胞)表位筛选IEDB MHC II结合服务器用于预测来自所选抗原蛋白的表位。首先,用选择的百分位等级预测小鼠等位基因(H2-IAb、H2-IAd、H2-IEd)的<10.然后,如第一次过滤中那样利用TMHMM、VaxiJen v2.0、AllerTOPv.2.0和ToX inPred服务器,例如用于CTL筛选。其次,通过IFN表位服务器筛选表位,选择具有诱导IFN-γ产生能力的表位。最后,将显示阳性结果的表位与表位库进一步交叉检查用于人类HLA II类结合的IEDB II类免疫原性服务器。与CTL筛选一样,选择大多数HLA II类覆盖表位作为最终HTL表位,然后进行群体覆盖分析。2.4. 线性和不连续B细胞表位筛选用于B细胞表位预测的可用网络服务器不够准确,并且B细胞表位预测是半低准确度程序。因此,在我们的研究中,我们通过多方法方法预测B细胞表位,包括(i)基于物理化学的方法(例如,Bcepred和基于IEDB的线性表位预测)和(ii)基于机器学习的算法(例如, ABCpred、BepiPred和LBtope)。我们最初使用ABCpred网络服务器作为BCL(B细胞淋巴瘤)预测(14,16,18和20-mer)的标准,此外,使用其他网络服务器通过交叉检查找到重叠表位。最后,通过VaxiJen v2.0、AllerTOP v.2.0和ToX inPred服务器筛选重叠的共有表位,以选择最终的线性BCL表位。在我们的研究中,我们还通过IEDB Ellipro工具预测不连续表位。结构蛋白用于该分析。从RCSB(Research Collaboratory for StructuralBioinformatics)和I-TASSER在线服务器检索结构蛋白的三维(3D)结构。最后,用IEDB Ellipro网络服务器交叉检查入围的重叠共有表位以找到重叠的不连续表位残基。2.5. 人口覆盖和保护分析入围的CTL和HTL表位以及各自的HLA等位基因医学博士 Khan等人医学信息学解锁24(2021)1005783=类型提交给IEDB人口覆盖率分析工具。分别对MHC I类和MHC II类以及在组合条件下进行计算从NCBI数据库中检索SARS-CoV-2其他毒株的结构蛋白序列IEDBEpitope Conservancy分析工具用于a> 100%的入围表位序列同一性阈值2.6. 疫苗构建和结构模型为了构建多亚单位疫苗,CTL、HTL和BCL用适当的接头以有序的方式连接。疫苗构建体在N末端以β防御素-3佐剂开始,随后是EAAAK接头和PADRE序列。加入GGGS接头以连接每个CTL表位,而GPGPG和KK接头分别用于连接HTL和BCL。最后,在C-末端添加额外的PADRE序列。通过EX PASy-ProtParam、Protein-Sol、VaxiJen v.20和AlgPred服务器分别分析所设计疫苗构建体的理化性质、溶解性、抗原性和致敏性使用具有比对的自优化预测方法(SOPMA)服务器预测疫苗蛋白的二级结构[18]。它预测了四种构象状态,包括螺旋X,β折叠和桥,转弯和线圈。Robetta服务器用于构建3D疫苗蛋白模型。通过RampageRamachandran图分析对生成的五个模型进行评估,而只有最好的模型在YASARA动力学套件中通过100 ns的MD模拟进行优化。2.7. 疫苗-TLRs复合物的分子对接及动力学模拟从蛋白质数据库(PDB)检索人TLR-3(PDB id 1 ZIW)、人TLR-4(PDB id:4G 8A)、小鼠TLR 3(3CIG)和小鼠TLR 4(PDB id 2Z64),并制备用于对接分析。蛋白质-蛋白质对接是通过ESPRINPro 2.0服务器进行的。基于 在最低能量分数上,选择并下载有效对接的复合物。评价了疫苗和TLR复合物之间的相互作用。使用YASARA动力学套件计算对接的Toll样受体TLR(人TLR 3,4和小鼠TLR 3,4)和构建的多表位疫苗复合物MD模拟[19]。还使用YASARA动力学套件来估计构象变化和所有可能的相互作用。在恒温(298 K)下使用NVT系综进行的所有MD模拟均考虑了AMBER 14 [20的使用0.9%浓度的NaCl盐来中和其中加入水分子(0.998 g/cm3密度)的系统。在所有情况下,细胞尺寸比复合物大一个长方体细胞盒,采用边界条件进行模拟。粒子网格埃瓦尔德(PME)方法[21]使用8.0 μm的截止半径进行长程静电相互作用计算。对于每个系统,每种情况的总模拟时间为100 ns MD模拟,时间间隔为100 ps2.8. 密码子改造,电子克隆在E。大肠杆菌表达系统及mRNA结构分析使用Jcat在线工具设计针对大肠杆菌的疫苗蛋白的优化密码子。coliK12表达系统。优化后的反向翻译序列避免了原核蛋白核糖体结合位点、rho非依赖性转录终止子和Acl I、NtoI、EgeI将通过Jcat服务器计算的GC含量和密码子适应指数(CAI)与来自GenScript服务器的结果进行比较和评估。通过SnapGene v5.1软件将高效的cDNA序列插入pETite N-His SUMO Kan载体(Lucigen,USA)中T7启动子下,其将翻译T7启动子。含有组氨酸标签、SUMO蛋白和疫苗蛋白的重组蛋白。通过RNAfold服务器预测融合蛋白的mRNA二级结构,检测其翻译效率和热力学稳定性。3. 结果3.1. 显著蛋白质利用NCBI数据库检索了21个结构蛋白和非结构蛋白的氨基酸序列。通过VaxiJen服务器评估所有蛋白质,其产生占其抗原性应答优势的每个蛋白质序列的总评分。如补充表S2所示,我们发现13种蛋白质(nsp4、nsp 6、nsp 9、endoRNA酶、刺突、ORF3a、Envelop、ORF6、ORF7a、膜、ORF8、核衣壳和ORF10蛋白)的抗原性评分大于0.45。基于抗原评分,选择这些蛋白质用于进一步设计多表位疫苗。3.2. 细胞毒性T淋巴细胞(CTL)表位的鉴定和评价结构和非结构蛋白的CTL表位最初通过两阶段过滤/筛选过程预测。通过NetCTL1.2服务器进行CTL选择后进行第一次过滤,其预测长度为9-mer的CTL表位。通过NetCTL1.2服务器筛选CTL表位后,在第一次筛选过程中通过抗原性、变应原性、非特异性和免疫原性检查筛选表位。最后,在第二次筛选中通过与小鼠等位基因的最佳结合亲和力来评估表位。通过NetCTL 1.2服务器从13种蛋白质中预测了约1582个表位,并且在第一阶段过滤中从1582个表位中筛选出109个CTL表位,如补充文件1所示。如补充文件1所示,在第二过滤阶段中从109个表位中选择了54个CTL表位。3.3. HTL(辅助性T淋巴细胞)表位的鉴定和评价最初,通过IEDB服务器针对小鼠MHC-II等位基因(H2-IAb、H2-IAd、H2-IEb)预测13种蛋白质的HTL表位。最重要基于其百分位等级选择表位,其应小于10。从IEDB MHC-II服务器预测约703个HTL表位(补充文件2)。随后,通过遵循CTL-第一过滤过程筛选这些表位。然而,对于9种蛋白质,包括nsp 4、nsp 6、nsp 9、刺突、膜、包膜、ORF 3a、ORF 8和核衣壳蛋白以及它们各自的小鼠等位基因,预测了总共120个独特的HTL表位。之间这120个表位在通过IFN表位服务器第二次过滤后,仅发现59个表位为IFN-γ阳性,如补充文件2中所提供的。3.4. B细胞表位和不连续B细胞表位的预测使用多方法方法鉴定刺突蛋白、包膜蛋白、膜蛋白和核衣壳蛋白的最显著线性B细胞表位,详见方法章节。最初,从所有四种结构蛋白的ABCpred服务器生成线性B细胞表位库。从初始库中筛选出具有较高抗原性、非毒性和非过敏性的表位。在刺突蛋白的情况下,最终选择两个共有14-mer表位(S206-219和S374-388)用于疫苗构建。IEDB Bepipred 2.0方法预测了残基编号206 - 217和369 - 394的表位,这些表位作为线性B淋巴细胞表位易于诱导免疫应答(图S1 a)(补充文件3)。这些位置的大多数残基也被其他IEDB工具预测,如Chou和Fashman B转角预测(图S1b)、Emini表面可及性预测(图S1b)、方法(图S1c),和Karplus 和 舒尔茨柔性医学博士 Khan等人医学信息学解锁24(2021)1005784≤≤≤----预测方法(图S1d)。Bcepred和LBtope网络服务器也确保了这最后两个B细胞表位(S206-219和S374-388)可以作为线性B细胞表位。此外,IEDB中的Ellipro工具还通过使用刺突蛋白晶体结构6VSB [22]确认了来自ABCpred的这些入围表位是线性和不连续表位的一部分,如补充文件3所示。在包膜蛋白的情况下,选择来自ABCpred的一个共有BCL表位(E57-73)作为最终表位。最初,IEDB预测方法预测只有57至71个残基中的一个表位可以作为线性B淋巴细胞表位诱导免疫应答(补充文件3)。此外,该区域在其他IEDB工具中也最常见,包括Chou和Fashman B转弯预测、Emini表面可达性预测以及Karplus和Schulz柔性预测,如图S2所示。此外,这个残差在Bcepred和LBtope Web服务器预测中很常见。IEDB中的Ellipro工具还通过使用从I-TASSER网络服务器检索的包膜蛋白晶体结构(QHD 43418)(补充文件3)再次确认了来自ABCpred的该最终表位是线性和不连续表位的一部分。同样,来自膜蛋白和N蛋白的两个BCL表位(M176-193, N91-106)基于它们在另一种预测方法中的一致性结果进行选择,如补充文件3,图S3和S4所示。因此,我们获得了最终5个共有BCL表位,用于具有更高抗原性、非毒性和非过敏性特性的疫苗设计(补充文件3)。3.5. 表位保护、最终表位预测和群体覆盖率分析为了有效的免疫,在世界各地的其他菌株的表位保护是必不可少的。表位保守性分析的结果显示,除了E蛋白的一个B细胞表位显示96%保守性之外,最终蛋白的CTL、HTL和B细胞表位是100%保守的,如补充文件1、2和3中所示。 3 .第三章。经过保守性分析,我们选择了最终的CTL和HTL表位。我们从每种蛋白质中选择了总共12个CTL表位,考虑到它们的高抗原性和免疫原性评分以及多种类型的小鼠等位基因和人超型覆盖率(补充文件1)。此后,我们预测了来自IEDB服务器的12个CTL表位中的每一个的MHC-I结合等位基因。选择预测的截断值作为百分位数秩1,并且根据IEDB建议,使用百分位数等级1作为预测MHC-I的肽结合剂的截止值,使用百分位数等级10作为预测MHC-II的肽结合剂的截止值[23]。在CD4+ T细胞表位预测的情况下,类似地,9 HTL表位预测也是如此。通过考虑它们的小鼠等位基因百分位数等级、高抗原评分和百分位数等级10以下的这些结合物所覆盖的HLA-II等位基因的最大数目,从每种蛋白质中选择表位(补充文件2)。在IEDB人群覆盖率工具中选择12个CTL表位和9个HTL表位及其对应的HLA等位基因在世界13个地区进行人群覆盖率分析。我们发现,全球人口的87.12%(CTL)和90.42%(HTLs)以个体方式覆盖(补充文件4)。由于CTL和HTL表位包含在疫苗蛋白中,因此我们关注它们的组合覆盖率,其占全球人口的98.64%。三个国家的覆盖率最高(100%),欧洲、北美和东非。另外,CTL表位和HTL表位中的每一个的平均群体覆盖率可以在补充文件4中找到。3.6. 疫苗构建和理化分析基于其抗原性质、结合能和非过敏性特性,通过使用GGGS、GPGPG和KK接头将总共12个CTL、9个HTL和5个BCL表位连接在一起以构建最终疫苗在疫苗的N-末端加入佐剂以保护其不被降解。此外,使用EAAAK接头将佐剂连接至CTL表位。另一方面,GGGS、GPGPG和KK接头与CTL、HTL和BCL表位连接,如图Ia所示。最终的疫苗构建体由502个氨基酸组成(图1B)。 1 b)。构建疫苗的评价理化性质见表S3。通过鉴定10.06的等电点(PI),发现疫苗构建体本质上是碱性的,52.29 kDa分子量(MW)。此外,计算在哺乳动物网织红细胞(体外)、酵母(体内)和E. coli(in vivo)。重力估计为0.316,表明其本质上是疏水的。此外,发现疫苗构建体在E. coli系统表达。发现疫苗的热稳定性(脂肪族指数)为89.34,其含有较高量的疏水性氨基酸。此外,计算出不稳定指数(II)为33.48,表明蛋白质在湿实验室中是稳定的。此外,疫苗设计的抗原性为0.6045,由Vaxijen服务器计算,这表明疫苗具有免疫原性,可以刺激足够的免疫应答。3.7. 疫苗的同源性建模、优化和结构质量为了分析疫苗构建体的三级结构,利用502个氨基酸的肽序列预测同源性模型(图S5a)。Robetta服务器基于比较建模和从头算方法预测了所设计的疫苗蛋白的5种同源性模型。通过在生理环境中进行100 ns的MD模拟来优化疫苗构建体的初始同源性模型。在分子动力学模拟过程中同源模型的稳定性是由其偏离基本结构的RMSD确定。整个MD模拟轨迹中疫苗蛋白的RMSD-Cα值见图S5 b。同源性疫苗蛋白的模型在50 ns后达到稳定状态,其RMSD-Cα平均值为8.72nm。用分子动力学模拟优化了疫苗原的同源性模型,通过Ramachandran图评价蛋白质。结果表明,93%的残基分别位于最有利的区域,6%位于额外的允许区域,0.3%位于不允许区域,如RAMPAGE服务器所预测的(图S5c)。ERRAT和Verify3D服务器也检查了模型质量,其中疫苗构建体的质量分别为86.62%和87.45%通过SOPMA网络服务器预测最终疫苗构建体的二级结构,其根据疫苗蛋白的氨基酸序列预测二级结构。在502个氨基酸中,187个参与β折叠形成,185个参与卷曲形成,而α螺旋和β转角分别由91个和39个氨基酸形成。总体二级结构预测结果表明,37.25%为卷曲,36.85%为β链,18.13%为α螺旋,7.77%为β转角,如图S6所示。3.8. 疫苗与人和小鼠TLR使用人TLR(3,4)和小鼠TLR(3,4)作为受体,用于使用TMPPro与疫苗构建体进行对接分析,计算的能量评分列于表1中。人TLR3和TLR4的能量评分分别为1400.3和1713.7,和小鼠TLR3和TLR4分别为1436.6和1393.4。 对这些复合物进行MD模拟以分析它们的稳定性。为了评估构建的疫苗复合物的动力学,进行MD模拟。α-碳、Rg和RMSF的RMSD医学博士 Khan等人医学信息学解锁24(2021)1005785Fig. 1. (a)多表位疫苗构建体中的T和B细胞表位的示意图。(b)最终构建的502个氨基酸长的疫苗,其中残基连接至佐剂、PADRE、EAAAK(接头)、GGGS(接头)、GPGPG(接头)和KK(接头)。表1疫苗构建体与TLR的对接评分TLR名称最低能量人TLR 3-1400.3人TLR 4-1713.7小鼠TLR 3-1436.6小鼠TLR 4-1393.4分析蛋白质的所有氨基酸残基100 ns。在人TLR3复合物的情况下,RMSD显示0.53纳秒的初始偏差,并在50纳秒时逐渐增加到4.11纳秒。在55和85 ns之间,波动急剧增加,然后稳定,直到模拟结束,如图2a所示。在小鼠TLR 3复合物的情况下观察到类似的模式;波动在5-35 ns,RMSD值范围为0.52-4.40 ns。然而,发现人和人的平均偏差分别为4.75 μ m和4.61 μ m,小鼠TLR3复合物。相反,在人TLR4和小鼠TLR4复合物中没有观察到明显的偏差。在35 ns结束后,模拟揭示了两种复合物的稳定性质,具有温和的波动。在分子动力学模拟过程中,研究蛋白质结构的紧密性,我们分析了回转半径(Rg)。Rg值显示人TLR 4复合物与其他三种TLR复合物结构之间存在很大差异,其中人TLR 3和小鼠TLR(3和4)复合物的Rg值有增加的趋势,如图2b所示。在人TLR 4复合物的情况下,从模拟开始到结束观察到最低Rg值,其为~32.18 μ g(平均值)。与此相反,人TLR3复合物的Rg值较高,平均为36.23 μ g,其次是小鼠TLR4(平均为35.71 μ g),然后是小鼠TLR3(平均为35.66 μ g)。此外,分析氨基酸残基的均方根波动(RMSF)以研究受体-配体相互作用的稳定性(图3)。在RMSF图中,在氨基酸残基中观察到轻微波动, 可以反映了受体和配体复合物之间的不断相互作用结果,曲线图中的高度波动区域表明受体-配体复合物中的柔性程度增加。为了进一步了解和理解对接复合物之间的残基相互作用,我们在使用PDBsum算法进行MD模拟后分析了非键合和氢键相互作用[24]。构建的疫苗产生与人TLR 3的9个H键相互作用(图4a和表S4)和与小鼠TLR 3的3个盐桥和12个H键相互作用(图4b和表S4)。另一方面,构建的疫苗与人TLR 4形成1个盐桥和8个H-键相互作用,并形成4个盐桥和27个H-键相互作用,如图所示(图1B)。 4 c、d和表S4)。3.9. 用于在E.大肠杆菌和mRNA二级结构分析评价并比较疫苗构建体的优化的1506bp长的核苷酸序列的密码子优化指数(CAI)和GC含量。为了在生物体中获得更好的表达(转录和翻译),GC含量在30%至70%之间被认为是最佳的,而CAI值必须高于0.8至1 [25,26]。从Jcat和GeneScript服务器获得的优化核苷酸序列的GC含量分别为53.25%和56.79%,计算的CAI值分别为0.92和0.78由于Jcat服务器产生了更好的优化密码子,因此将该核苷酸序列用作SnapGene v 5.1中的目的基因(GOI)以构建重组pETite N-HisSUMO Kan质粒载体(Lucigen,USA)。在GOI的3′端添加终止密码子TAA,然后进行限制性内切酶酶切在GOI的上游添加Acl I限制性位点(C-末端),然后添加部分SUMO核苷酸序列(图5)。如果在E. coli K12,构建的载体将产生一个大的融合蛋白,该融合蛋白起始于蛋氨酸(N-末端),随后是与SUMO蛋白和疫苗蛋白连接的six组氨酸标签(C-末端)。 后 除名 标签 在下游医学博士 Khan等人医学信息学解锁24(2021)1005786-图二. 配体-受体复合物(疫苗TLR)的分子动力学模拟。&(a)均方根偏差显示对接复合物的稳定性。(b)Rg图显示疫苗构建体在模拟时间期间以其紧凑形式稳定图三. 均方根波动(RMSF)图。 峰显示具有高灵活性的区域。在本发明的方法中,天然疫苗蛋白可以通过加入SUMO蛋白酶来获得,所述SUMO蛋白酶将切割SUMO融合蛋白,从而释放出具有所设计的天然N末端残基(佐剂的甘氨酸)的确切疫苗蛋白。此外,表达基因的mRNA结构需要稳定,5′端不应有假结或长的稳定发夹。RNAfoldserver预测表达的mRNA二级结构的最小自由能(MFE)为622.10kcal/mol。MFE较低表明mRNA二级结构的较高热力学稳定性 (图S7)。在表达的mRNA的5′端没有检测到假结或稳定的发夹,甚至前10个核苷酸也没有形成二级结构这些发现表明基因构建体在大肠杆菌中的高水平表达[27,28]。coli K12,从而促进疫苗蛋白的生产。4. 讨论疫苗被认为是最有潜力的免疫方式[29,30]。疫苗的生产和开发相对具有成本效益,但这是一个费力和耗时的过程[31,32]。鉴于目前分子免疫学和计算的进展,研究人员正在改变传统的疫苗学方法,并应用免疫信息学方法(反向疫苗学)来合理设计疫苗,特别是针对感染性疾病[33]。通过使用免疫信息学方法,首次设计了针对血清群B脑膜炎奈瑟菌的疫苗 [34]并成功生产。从那时起,许多疫苗被开发出来,以对抗肺炎衣原体、肺炎链球菌[34]、H. pylori [35]、肠杆菌性大肠杆菌[36]、普氏立克次体[37]基于医学博士 Khan等人医学信息学解锁24(2021)1005787见图4。疫苗构建体-TLR对接复合物。100ns分子动力学模拟后获得的数据。对接的疫苗和TLR复合物之间的相互作用残基进行了说明。免疫信息学策略。本研究以SARS-CoV-2的13个蛋白为靶点,设计了一种多表位疫苗。多表位疫苗与传统的基于单表位的疫苗相比具有几个优点:a)MHC I类和II类的多个表位可以被TCR识别; b)CTL、HTL和B细胞表位可以重叠,因此具有同时诱导细胞和体液免疫的免疫应答c)佐剂与疫苗表位的连接提供了持久的免疫原性。免疫应答,d)可以避免体外抗原表达的并发症[38理想的多表位疫苗应同时包含两类抗-基因表位,包括T细胞和B细胞表位,以产生针对预测抗原的特定免疫应答[42]。因此,从SARS-CoV-2的13个蛋白中预测了T细胞根据其免疫原性,如抗原性、致敏性、细胞因子等,医学博士 Khan等人医学信息学解锁24(2021)1005788图五. 在大肠杆菌T7启动子下插入pETite N-His SUMO Kan质粒载体的疫苗构建体的优化密码子(1506个碱基对)。coli表达。将目的基因插入AclIi和AclII之间的5′端。生产在大多数情况下,我们允许疫苗蛋白中的可变表位并丢弃重叠表位。最终的多表位疫苗构建体包含12个CTL表位(nsp 4343-351,nsp 6 28-36,nsp 9 67-75,nsp 15 2-10,ORF 3a 225-232,ORF 6 7-15,ORF7a 8- 16,ORF 10 8- 16,S 1060-1068、E 25-33、M 26-34和N 105-113),9个HTL表位(nsp 4118-132,nsp 639-53,nsp 997-111,ORF 3a87-101,ORF 85-19,S511-525,E25-39,M138-152和N310-324)和4个BCL表位(S373-387、E57-72、M176-193和N91-106)。疫苗构建体具有502个氨基酸残基(52.29 kDa),具有佐剂β防御素(45 mer肽)[43]、PADRE序列[44]和接头。佐剂序列是TLR的显著激动剂,TLR对于激活先天性和适应性免疫的不同介质是必需的,与疫苗开发相容[45,46]。还在疫苗蛋白的N-末端处将该佐剂与EAAAK接头连接,合并以有效分离双功能融合蛋白[47,48]。EAAAK接头与PADRE序列连接,PADRE序列是辅助T细胞表位之一,对增强不同抗原的CTL应答具有重要意义[49]。 此外,GGGS [50]和GPGPG [51]接头与CTL和HTL表位合并,以有效识别和分离多表位疫苗[48]。最后,将BCL表位与KK接头连接,以保留其独特的免疫原性活性[52]。然而,疫苗的有效性取决于接种疫苗的广泛人群覆盖率[53]。对51株SARS-CoV-2毒株进行表位保守性分析。值得注意的是,该构建体在致病性入侵省显示了98.64%的全球人口覆盖率(如前所述)。因此,这种构建的疫苗将覆盖全球大多数人口。发现最终的疫苗构建体本质上是碱性的并且稳定在生理pH范围内,如通过生理化学分析预测的。此外,估计的脂肪族指数评分显示疫苗更耐热,而阳性GRAVY表明其疏水性,表明与氨基酸残基的强相互作用。 在此外,发现该构建体在过表达过程中可溶,E. coli系统。为了有效运输到体内,疫苗构建体应该与Toll样受体(TLR)具有强的结合亲和力。尽管TLR在病原体的鉴定和针对病毒的先天免疫应答的建立中发挥重要作用,但SARS-CoV-1的TLR识别尚未得到充分表征[54]。在这项研究中,我们首先评估小鼠TLR(3和4)针对疫苗构建体的对接分析,并将其分别与人TLR(3和4)进行一项研究显示,小鼠TLR 3和TLR 4对SARS-CoV-1更敏感[54]。最近,用小鼠TLR 4针对MERS-CoV的S蛋白他们还制定了快速开发临床级MNA SARS-CoV-2亚单位疫苗的标准操作程序[55]。选择TLR3的另一个理由是它可以识别冠状病毒的RNA或dsRNS基因组,而TLR4可以识别冠状病毒的外部组分刺突蛋白[56]。对接评分显示,疫苗构建体与人和小鼠TLR具有高结合相互作用,从而表明疫苗可以触发TLR活化并可以增强针对SARS-CoV-2的免疫应答。分子动力学研究可以提供有关稳定性的信息疫苗-TLR复合物。在RMSD结果的情况下,对于疫苗-人TLR 3复合物,在55-85 ns观察到轻微波动,然而,所有疫苗-受体复合物在整个100 ns模拟时间内高度稳定。这些结果符合结构紧凑性和 高 程度 疫苗受体复合物的灵活性用Rg和RMSF进行分析。此外,通过PDBSum测定疫苗和TLR之间的分子间蛋白质-蛋白质相互作用(图4和表S4)。结构分析表明,与TLR3相比,疫苗蛋白与TLR4形成了更多的氢键和盐桥相互作用。在人和小鼠TLR3的情况下,人TLR3与疫苗蛋白形成9个氢键相互作用,小鼠TLR3与疫苗蛋白形成12个氢键相互作用,尽管3个氢键相互作用与疫苗蛋白形成12个氢键相互作用。医学博士 Khan等人医学信息学解锁24(2021)1005789小鼠TLR3复合物中存在盐桥相互作用,而人TLR3复合物中不存在这种类型的相互作用。另一方面,人TLR4与疫苗蛋白形成8个氢键相互作用,小鼠TLR4与疫苗蛋白形成27个氢键相互作用。虽然在两种复合物中均产生了盐桥相互作用,但在疫苗构建体的残基Arg438上发现了共同的盐桥相互作用。在所有非共价相互作用中,盐桥是最强的相互作用,并在很大程度上有助于生物分子的稳定性[57]。计算机克隆和相应的mRNA二级结构分析显示,可以在湿实验室试验中实现有效的基因表达和翻译起始。在我们的研究中,SARS-CoV-2的某些表位对于T细胞和B细胞应答是显性的,并且这些表位在序列方面与SARS-CoV-1几乎很保守。其中,SARS-CoV-2S1060 -1068 CTL表位在SARS-CoV-1S1042 -1050中具有100%的保守性,可诱导回忆反应当IFN-γ刺激血液中的CD 8+ T细胞时,正常健康
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功