没有合适的资源?快使用搜索试试~ 我知道了~
医学信息学解锁27(2021)100781应用免疫信息学方法构建SARS-COV-2Saad Al Zamanea,1,Fahim Alam Nobelb, 1,Ruksana Akter Jebin b,Mohammed BadrulAmin c,Pratul Dipta Somaddera,Nusrat Jahan Antora d,Md Imam Hossaina, **,Mohammod Johirul Islamb,*,Kawsar Ahmede,*,Mohammad Ali MonifaMawlana Bhashani科技大学生物技术和遗传工程系,Santosh,Tangail,1902年,孟加拉国b孟加拉国坦盖尔Santosh Mawlana Bhashani科技大学生物化学和分子生物学系,1902年c国际腹泻病研究中心,Mohakhali,Dhaka,1212,Bangladeshd孟加拉国,达卡,阿夫塔布纳加尔,东西方大学,科学和工程学院,遗传工程和生物技术系,1212e1902年,坦盖尔,桑托什,Mawlana Bhashani科技大学,信息和通信技术系,生物摄影小组孟加拉国f孟加拉国Pabna科技大学计算机科学与工程系,Pabna,6600A R T I C L EI N FO保留字:分子对接表位电子克隆密码子优化SARS-CoV-2的分子动力学模拟A B S T R A C T冠状病毒家族在过去二十年中一直在感染人类,但正在进行的冠状病毒SARS-CoV-2对全球公共卫生安全构成了神秘的挑战。自去年以来,这种病毒的诱变性质正在导致其遗传物质的变化。为了预防这些情况,FDA批准了一些紧急疫苗,但不能保证这些疫苗在复杂的人体系统中正常发挥作用。本研究通过应用计算机结构生物学技术和先进的免疫信息策略,为开发一种基于免疫表位的治疗方法以快速利用SARS-CoV-2做出了短暂而有效的努力。从SARS-CoV-2的表面、膜、囊膜蛋白中筛选抗原表位,并通过多种免疫学筛选,以确定最佳抗原表位。可能的一结果表明,7个CD_4~+、10个CD_8~+和5个B细胞抗原表位是显著的,免疫原性,最重要的是,在128个孟加拉国和110个其他感染国家的SARS-CoV-2变异体中高度保守。然后将筛选出的抗原表位与佐剂通过合适的接头连接,最终形成多表位疫苗。免疫模拟表明,该工程疫苗可以激活体液和先天免疫反应。为了预测有效结合,在疫苗和免疫受体(TLR)之间进行分子对接。强结合亲和力和良好的对接评分阐明了疫苗的严格性。此外,在最高结合亲和力复合物内进行MD模拟以观察稳定性。密码子优化和其他理化性质表明,该疫苗将适合于在克隆水平上更高表达。因此,通过监测计算机模拟的总体评估,我们预计我们的工程疫苗将是一种可行的预防COVID-19的方法。1. 介绍人口不断增加,其流动性导致城市化,环境和生态变化导致许多传染病的扩散[1,2]。人类已经目睹了许多传染病,这是无关紧要的,甚至造成全球性的破坏[1]。新型流感样病毒应该于2019年12月19日在中国武汉市出现,最初被称为新型冠状病毒-2019 [32020年2月11日,国际病毒分类委员会(ICTV)* 通讯作者。Mawlana Bhashani科技大学信息和通信技术系,Santosh,Tangail,1902年,孟加拉国。** 通讯作者。*** 通讯作者。电子邮件地址:imubcmb@gmail.com(M.I. Hossain),johir75@yahoo.com(M.J. Islam),kawsar.ict@mbstu.ac.bd(K.Ahmed)。1 在这项研究中的贡献。https://doi.org/10.1016/j.imu.2021.100781接收日期:2021年7月3日;接收日期:2021年10月29日;接受日期:2021年10月30日2021年11月3日网上发售2352-9148/©2021的 自行发表通过Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)中找到。可在ScienceDirect上获得目录列表医学信息学期刊主页:www.elsevier.com/locate/imuS. Al Zamane等人医学信息学解锁27(2021)1007812+=≤==-=-==-==-==-==-宣布这种病毒为严重急性呼吸系统综合征-2(SARS-2)。于二零二零年三月十一日一个月后,由于全球有118326宗确诊病例及4292人死亡,COVID-19被世界卫生组织宣布为大流行病截至2021年9月25日,病毒已迅速蔓延至235个国家、地区及地区,录得229,858,719宗确诊病例及4,713,543人死亡[https://covid19.who.int]。孟加拉国于3月8日发现首例COVID-19病例。自那时以来,截至9月25日 , 已 登 记 了 1 , 548 , 320 例 确 诊 病 例 和 27 , 337 例 死 亡[https://covid19.who.int]。冠状病毒通常会引起中度呼吸道感染,如普通感冒。尽管如此,新开发的冠状病毒仍有许多临床症状,如低热、干咳、呼吸困难、疲惫、胃肠道问题、腹泻[6上呼吸道和下呼吸道的炎症也被发现会引起急性呼吸道感染[3]。COVID-19的中位潜伏期为3天(范围为0至24天),首次出现症状至死亡的中位时间为14天(范围为6至41天)[12,13]。许多COVID-19患者可能会出现呼吸急促,在某些情况下,患者可能会出现感染性休克、难以纠正的代谢性酸中毒或凝血障碍[14]。它还可能影响许多器官,其中包括肾脏和心脏是非常常见的[15,16]。 症状可能因人而异人;例如,有些人可能会出现非常轻微的症状,没有任何发烧,并在1-4周内恢复,而其他人可能会感染,有些人可能会死亡[ 17,18 ]。然而,有身体并发症的老年人比年轻人和儿童的死亡风险更高[19]。与其他冠状病毒一样,COVID-19是一种有包膜的单链正义(SSRNA)病毒[20估计SARS-CoV-2的基因组长度为30千碱基(26000至32000个碱基)[23,24]。多项研究报道,SARS-CoV-2的全长基因组序列与蝙蝠冠状病毒有很大的相似性,与SARS-CoV的相似性为45-90%,与MARS-CoV的相似性较小,约为20-60%。由于这个原因,人们认为蝙蝠可能是SARS-CoV-2的原始宿主,但中间宿主现在仍然未知[11]。SARS-CoV-2的基因组序列计算分析这也是一种用于疫苗设计的快速计算方法。假设结构蛋白和非结构蛋白都是疫苗靶点的潜力[30],但我们只关注结构蛋白(S,M,E)。已经基于靶向表面糖蛋白受体结合结构域(RBD)结构域进行了几个实验。但是,RBD上的快速突变和RNA病毒的高基因组变异有机会使新毒株逃脱当前RBD靶向抗体的中和[31-35 ]。因此,考虑到全长表面、包膜和膜蛋白已被用于除核衣壳之外的多表位疫苗构建体。取消选择这种核衣壳的原因是它们在感染期间最初无法进入宿主细胞的外表面。因此,在当前的研究中,多种免疫信息学服务器和工具已被应用于预测SARS-CoV-2的整个毒株中高度保守的细胞毒性T淋巴细胞(CTL)、辅助T淋巴细胞(HTL)、线性B淋巴细胞(LBL)表位(总共选择了238个基因组序列,通过优先考虑128个孟加拉国序列和110个来自单独受影响国家的序列来观察保守性)(补充文件-S,M,E)。有了这些预测,我们试图通过将每个选择的表位与相应的接头组合来开发合适的多表位疫苗候选物,其中,佐剂也被结合在第一位置以增强免疫应答。构建体的免疫原性。通过这种方式,我们希望我们设计的疫苗将产生适当的免疫应答,并可用于对抗SARS-CoV-2。整个研究过程在图1中以图形摘要的形式进行了说明。1.一、2. 方法和材料2.1. 序列检索和系统发育树构建从NCBI数据库中提取β家族冠状病毒(HCOV-OC 43、HCOV-HKU1 、 SARS 、 MARS 、 HCOV-NL 63 、 HCOV-229 E&SARS-CoV-2 ) 表面、膜和囊膜蛋白的氨基酸序列。分配的登录号为HCoV-HKU 1编码 六X青少年 非结构 和 四 主要 结构蛋白(YP173238.1= S, YP173241.1= M, YP173240.1= E),MERS-CoV[15 ]第10段。这四种结构蛋白(表面糖蛋白、包膜蛋白、膜蛋白和核衣壳)是病毒组装的基本组成部分[25]。有了这些蛋白质,SARS-COV-2为入侵宿主铺平了道路[15,22,23]。在所有这些结构蛋白中,SARS-CoV-2的病毒进入是由表面(S)糖蛋白介导的[26]。膜(M)蛋白由三个结构域组成,每个结构域通过与核衣壳(N)结合来负责膜的弯曲、病毒体的形状。包膜(E)蛋白参与病毒致病、病毒粒子的组装和释放[15]。称为核衣壳的第四种结构蛋白包含两个不同的结构域;两者都与病毒RNA基因组结合,但它们的结合机制彼此不同[11]。在非结构蛋白的情况下,一些研究报道它们对于SARS-CoV-2的复制是必需的[11]。由于其高度传染性和迅速随着COVID-19蔓延到每个地区,世界卫生组织宣布COVID-19为国际关注的突发公共卫生事件(PHEIC),并呼吁立即实施充分有效的护理。因此,世界各地的科学家正在竞相开发合适的候选疫苗,其中一些已经获得FDA批准用于紧急使用。然而,随着大流行的进展,SARS-CoV-2不断发生多次突变,并有可能改变其致病性[27]。这种RNA病毒的传播速度比上个世纪的任何其他病毒都要快[28,29]。因此,有必要生产越来越多的新候选疫苗,这些疫苗将通过提供持久的免疫力来对抗所有突变株。这只能通过计算方法在短时间内和低成本下实现。因此,我们努力通过应用免疫信息学工具开发基于计算机多表位的疫苗。它是生物信息学的一个子集,使用( YP009047204.1 S 、 YP009047210.1 M 、 YP009047209.1 E ) 、HCoVNL63 ( YP003767.1 S 、 YP003770.1 M 、 YP003769.1 E ) 、HCoV-229 E(NP073551.1 S、NP073555.1 M、NP073554.1 E)、SARS-CoV-2 ( QJU11812.1 S 、 QJU11815.1 M 、 QJU11814.1 E ) 、HCoV-OC 43( YP009555241.1 S ,YP009555244.1M ,YP009555243.1 E),SARS-CoV(NP828851.1 S,NP828855.1 M,IE)。孟加拉国第一个测序的SARS-CoV-2基因组被选为达卡儿童健康研究基金会的参考序列[36]。为了研究它们的进化联系,使用MEGA X(邻近连接算法),使用默认设置和自举法构建1000次重复的系统发育树[37]。2.2. 用于疫苗构建体的2.2.1. CTL表位预测应用IEDB MHC I处理工具(http://tools.iedb.org/processing/)根据IEDB推荐的方法鉴定CTL(细胞毒性T淋巴细胞)表位。为了评估肽与MHC I类等位基因之间的结合相互作用,我们将阈值调整为50 nM(IC5050强结合剂)[38]。通过集中于三个基本组分来预测表位:MHC-I结合、蛋白酶体加工和转运效率以及TAP转运[39]。在预测之后,使用IEDB MHC I结合工具(http://tools.iedb.org/mhci/),使用稳定化矩阵方法(SMM)来发现表位与27个参考等位基因的结合能力。2.2.2. HTL表位预测IEDB MHC-II结合预测工具(http://tools.iedb.org/mhcii/)S. Al Zamane等人医学信息学解锁27(2021)1007813≤≤≤Fig. 1. SARS-COV-2多表位疫苗设计流程图。红圈中的数字,代表着整个过程的先后。(For在这个图例中,颜色的参考解释,读者可以参考本文的Web版本使用SMM方法预测针对一组27个人参考HLA的HTL表位。根据表位的IC50值对表位进行优先排序[40]。50 nM的IC 50值表明对MHC-I II的结合亲和力最高,500 nM处于中等范围,5000 nM对应于最低结合亲和力[41]。&2.3. B淋巴细胞表位预测B细胞表位可能是能够干扰B细胞的潜在抗原[42]。因此,使用免疫表位数据库分析资源(IEDB-AR)服务器的Kolaskar和Tangaoker抗原性和BepiPred 2.0工具预测线性B细胞表位[43,44]。2.4. CTL、HTL、LBL表位的抗原性及变应原预测使用VaxiJen2.0服务器手动评估指定表位(CTL、HTL、LBL)的抗原潜力[45]。对于抗原性的预测,使用0.4的阈值避免VaxiJen评分小于0.4的非抗原性表位,而选择VaxiJen评分大于0.4的抗原性表位用于将来的研究。为了尽量减少对选定表位的过敏反应,使用AllerTOPv.2.0服务器验证了所有CTL、HTL和LBL表位的过敏原性状态[46]。2.5. CTL表位来自IEDB服务器的MHC I类免疫原性工具用于定量细胞毒性T细胞表位(CTL)的免疫原性[47]。开发此工具以指示肽的免疫原性基于它们的氨基酸位置和特征。2.6. 毒性预测使用ToX inPred服务器(http://crdd.osdd.net/raghava/toX inpred/)估计表位(CTL、HTL、LBL)的毒性,以确保其非毒性性质[48]。该服务器根据表位的物理化学性质显示其对X性和非对X性[39]。2.7. 胡萝卜素诱导HTL表位进一步检查预测的HTL表位诱导各种细胞因子的能力[44]。IFN表位( http://crdd.osdd.net/raghava/ifnepitope/) [49] 、 IL4pred(http://crdd.osdd.net/raghava/il 4pred/ ) [50] 和 IL-10 pred ( http://crdd.osdd.net/raghava/IL-10pred/)服务器[51,52]使用默认设置进行预测2.8. 表位的群体覆盖率和保守性分析HLA等位基因的变体在全世界范围内以不同程度的频率被发现[53]。因此,使用IEDB群体分析工具(https://tools.iedb.org/population/)来确认我们选择的CTL和HTL表位的群体覆盖率[54]。此外,通过R编程语言4.0版本创建了一个和弦图,以显示国家,大陆和种族群体之间的关系。表位的保守性是至关重要的,因为它意味着对SARS-COV-2的不同菌株的更广泛的保护。通过过滤GSAID [55],总共获得了238个基因组序列(128个来自孟加拉国,110个来自其他受影响的国家)。我们S. Al Zamane等人医学信息学解锁27(2021)1007814====试图覆盖GSAID数据库中可访问的大多数受影响国家检索后,使用Bioedit软件进行多重序列比对,从这238个全基因组序列中分离S、M和E [56]。然后使用EX pasy翻译程序(http:web.expasy.org/translate/)将回收的S、M和E序列转化为蛋白质形式[57]。为了评估我们的首选表位的保守性,我们使用IEDB保守性工具[58]。2.9. T细胞表位与MHC等位基因的对接性能通过分子对接方法比较CTL和HTL表位与其伴随的MHC等位基因的结合亲和力[3]。将预测的排名靠前的表位(CTL,HTL)和它们各自的HLA等位基因结合物(HLA-A-68; 01,HLA-A-02; 06,&HLA-DRB1-01;01)提交至GalaxyPep-Dock服务器( http://galaxy.seoklab.org/cgi-bin/submit.cgi ? PEPDOCK 型 )[59]。使用蛋白质数据库(PDB)(https://www.rcsb.org/)检索HLA-A-02; 06(PDB ID-30 XR)、HLA-A-68; 01(PDB ID-6PBH)和HLA-A-68; 02(PDB ID-6PBH)的晶体结构。HLA-DRB 1 -01; 01(PDB ID-5V 4 N)[60],然后用BIOVIA DiscoveryStudio 2020处理以消除多余的配体[53]。在对接后,用Galaxy Refine服务器(www.example.com)修改了复合体http://galaxy.seoklab.org/cgi-bin/submit.cgi?类型REFINE)。使用PRODIGY网络服务器(https://wenmr.science.uu.nl/prodigy/)测试其结合亲和力[61]。2.10. 最终疫苗结构通过将所有可能的CTL、HTL和LBL表位与合适的佐剂和柔性接头组合,构建了多表位疫苗[62,63]。基于上述免疫过滤器,筛选并组合最佳潜在表位以产生单一肽链[64]。因为肽本身没有免疫原性,所以佐剂是刺激免疫应答所必需的[65,66]。 疫苗的顺序位置从佐剂(β-防御素)开始GIINTLQKYYCRVRGGRCAVLSCLPKEEQIGKCSTRGRKCCRRKK),然后是最高的CTL、HTL和LBL表位[38]。本研究中使用的接头是EAAAK、AYY、GPGPG和KK,其有助于佐剂和表位的连接。AYY接头有助于形成与TAP转运蛋白结合的有利位置GPGPG接头用于促进HTL应答并保留构象依赖性的辅助和抗体表位的KK接头结合了B细胞表位,并将佐剂添加到具有EAAAK接头的疫苗的N-末端,导致更有效的分离和更少的与其他疫苗结构域的2.11. 疫苗致敏性预测我们使用了几种方法来估计设计的疫苗序列的过敏性评分,具有较高 的 准 确 性 [39] 。 使 用 AllerTop v.2.0 ( https://www.ddg-pharmfac.net/AllerTOP/ ) [43] 和 AllergenFPv.1.0 ( http://ddg-pharmfac.net/AllergenFP/)服务器[68]验证疫苗的非过敏行为。2.12. 疫苗抗原性预测为了预测拟定疫苗构建体的抗原特征,使用了Vaxijen v2.0和ANTIGENpro。在0.4阈值下,Vaxijen v2.0提供了具有极佳准确性的抗原性(http://www.ddgpharmfac.net/vaxijen/VaxiJen/VaxiJen.html)[40,69]。ANTIGENpro(http://scratch.proteomics.ics.uci.edu/),一种基于机器学习算法利用实验验证的微阵列分析反应性数据预测总蛋白抗原性的服务器[30,70]。2.13. 蛋白质溶解度和跨膜螺旋使用SOLpro(www.example.com)[ 71 ]和Protein-Sol(https://www.example.com ) 服 务 器 [ 72 ] 测 定 疫 苗 构 建 体 protein-sol.manchester.ac.uk/http://scratch.proteomics.ics.uci.edu/SignalP-5.0(http://www. cbs.dtu.dk/services/SignalP/data.php )[73]和TMHMM Server v2.0(http://www.cbs.dtu.dk/services/TMHMM/)[74]用于检查任何信号肽和跨膜螺旋的存在。2.14. 疫苗构建体使用EXPASyProtParam服务器(https://web.expasy.org/protparam/)估计疫苗将候选疫苗输入服务器,计算特征,如分子量、蛋白质半衰期、不稳定指数、理论pI、氨基酸组成、脂肪族指数和GRAVY [76]。2.15. 与人蛋白质组的使用NCBI数据库中的BLASTP(https://blast.ncbi.nlm.nih.gov/Blast.cgi)搜索引擎来评估我们的基于表位的疫苗在人蛋白质组内的序列相似性没有抗原序列显示与人蛋白质组的相似性超过10%[77]。2.16. 二级(2D)结构预测PSIPRED v4.0(http://bioinf.cs.ucl.ac.uk/psipred/)服务器由两个前馈神经网络使用,其处理PSI-BLAST输出以预测疫苗2.17. 三级(三维)构造预测RaptorX(http://raptorx.uchicago.edu/ContactMap/)是一个公开的网络服务器,用于推断疫苗序列的3D结构。服务器使用深度学习技术预测三级结构,该技术通过由两个深度残差神经网络构建的超深度神经网络整合进化耦合(EC)和序列保守性信息[79]。2.18. 三级结构为了改进构建体的最佳3D结构,探索了三步方法;最初,通过两个独 立的 服务 器对 结构 进行 细化 : ModRefiner( https://zhanglab.ccmb.med.umich. edu/ModRefiner/ ) [80] 和Galaxy Refine ( http://galaxy.seoklab.org/cgi-bin/submit.cgi ? 类 型REFINE)[81]。然后使用Swiss-PDB Viewer [82]和Chiron在线网络服务器(https)将:dokhlab.med.psu.edu/chiron/login.php)[83].2.19. 三级结构验证部署了ProSA网络(蛋白质结构分析)、PROSINS(Ram-achandran图评估)和ERRAT服务器,以验证改进的3D结构并比较模型[84]。ProSA(https://prosa.services.came.sbg.ac.at/prosa.php),用于计算指定输入结构的总体质量得分。ProSA网络中包含3D分子视图,便于检测给定评分所指示的问题部分[85]。ERRAT(http://services.mbi.ucla.edu/ERRAT/)使用基于原子的经验方法来验证蛋白质结构。该程序将查询序列的非键合原子相互作用与可信的高分辨率晶体结构数据库进行比较[ 86 ]。最后,使用PROPERTIES服务器(www.example.com)获得Ram-achandran图,其指定建模结构的质量https://servicesn.mbi.ucla。S. Al Zamane等人医学信息学解锁27(2021)1007815===-[87].2.20. 疫苗构建体为了鉴定在具有正确几何结构的疫苗残基对之间建立二硫键的能力,使用了Design 2服务器(http://cptweb.cpt.wayne.edu/DbD2/)的二硫键[88]。2.21. 疫苗构建体中B细胞构象表位的预测B淋巴细胞使用网络服务器ElliPro(http://tools.iedb.org/ellipro/)来确定构象B细胞表位。每个预测的表位由ElliPro提供PI(突出指数)值。最后,为了查看表位,使用Jmol查看器[90]。2.22. 疫苗与受体的分子对接分子对接是一种计算方法,对于基于分子结合亲和力研究蛋白质-蛋白质相互作用模式至关重要[91]。为此目的,我们将我们的最终疫苗构建体与免疫治疗相关的TLR 2(PDB ID-6 mg)、TLR 3(PDB ID-5g80)、TLR 4(PDB ID-4g 8a)、TLR 7(PDB ID-5gmg)和TLR 8(PDBID-5g 8a)ID-4 qc 0)蛋白,因为这些相互作用对于引发足够的免疫应答至关重要。因为我们使用了来自蛋白质数据库的TLR结构,所以我们使用Discovery Studio 2020软件通过去除相关配体和水分子来制备受体[92]。实施高模糊性驱动蛋白质对接(HADDOCK)服务器(http://milou.science.uu.nl/services/HADDOCK2.2/haddockserver-easy.html)用于快速和准确的对接。 该服务器使用来自生物化学生物信息学和生物物理学方法的信息来增强对接采样和评分。服务器需要来自疫苗和受体的活性和被动残留物作为输入。CPROT服务器[93]预测了这些相互作用残基(主动和被动)。集群在对接后由HADDOCKRefinement服务器抛光[94]。最后,使用PDBsum(https://www.ebi.ac.uk/thorntonsrv/databases/pdbsum/Generate.html),对疫苗构建体和TLR之间的相互作用残基进行作图[95]。2.23. 最佳对接复合物的分子动力学(MD)模拟使用GROMACS模拟软件包(GROMACS 2020.4)对我们的顶部对接复合物进行分子动力学模拟。使用CHARMM 36力场在水中进行蛋白质-疫苗复合物的MD模拟100 ns;每10 ps写入轨迹和能量文件[96]。该体系在截短的八面体盒中溶剂化,含有TIP3P水分子。然而,通过添加122个钾离子和163个氯离子,在0.15 M KCl中进行模拟[97]。为了消除任何空间不相容性,使用最速下降法进行5000步的最小化,并在最大力1000(KJ mol-1 nm-1)内实现收敛。系统在NVT和NPT系综下分别平衡100ps(50,000步)和1000ps(1,000,000步),使用时间步长0.2和0.1 fs。模拟的生产运行在300 K的恒定温度和1 atm或bar(NPT)的压力下进行,使用弱耦合速度重新缩放(修改的Berendsen恒温器)和Parrinello-Rahman算法。弛豫时间设定为τT 0.1 ps和τP 2.0 ps。所有涉及氢原子的键长使用线性约束求解器(lincs)算法在理想键长处保持刚性,允许2 fs的时间步长。 非键相互作用的计算采用Verlet格式方向在每个时间步长中计算1.2 nm的短程截止内的相互作用。粒子网格埃瓦尔德(PME)用于计算静电相互作用和力,以解释长程截止之外的均匀介质。该复合物的生产运行了100 ns。可视化分子动力学(VMD)软件用于合并每次运行的输出轨迹[98]。最后,根据模拟中生成的轨迹确定蛋白质、疫苗和复合物的稳定性,如均方根偏差(RMSD)、均方根波动(RMSF)、分子力学泊松-玻尔兹曼表面积(MMPBSA)和主成分分析(PCA)[99]。计算了蛋白质、疫苗和复合物在不同热力学条件下的回转半径、温度、压力、密度、电势,以观察蛋白质、疫苗和复合物的致密性。采用R的Bio3D软件包绘制所有图[100] 和 MMPBSA 图 是 执行 使用 MMGBSA法[101].绘制Xmgrace图形绘制软件后,用于修改所有图[102]。2.24. mRNA结构预测RNAfold( http://rna.tbi.univie.ac.at/cgibin/RNAWebSuite/RNAfold.cgi)[103]和的mfold(http://unafold.rna.albany.edu/?web服务器[104]用于验证疫苗构建体的mRNA结构的稳定性。2.25. 免疫模拟C-ImmSimserver ( https://kraken.iac.rm.cnr.it/C-IMMSIM/index.php的?第0页)应用于使用位置特异性评分矩阵(PSSM)的疫苗构建体的免疫学模拟[4,38]。对于大多数疫苗,第1剂和第2剂之间的最短推荐我们的模拟需要1050个时间步(时间步约为8小时),近12个月。因此,在时间步长1,84,170处间隔四周给予三次肽注射[105]。2.26. 密码子优化和计算机克隆Java密码子自适应工具(Jcat)(https://www.jcat.de/)用于密码子优化方法以增强重组蛋白的表达。Jcat开发了疫苗的cDNA序列,同时进行 密码 子优 化和 反向 翻译[106] 。 为了 确保 最佳 蛋白 表达 ,使 用GenScript稀有密码子分析工具(https://www.genscript.com/tools/rarecodonanalysis)通过分析离散参数如序列的G-C浓度和密码子适应指数(CAI)来改进产物[107]。最后,使用Snap Gene v4.2软件(https://snapgene.com/)通过引入修饰的核苷酸将该序列导入pET28a(+)表达载体[108]。3. 结果3.1. 序列检索与系统发育树构建从NCBI检索了7个人冠状病毒S、M、E蛋白序列,以产生系统发育关系(图2)。分析表明,SARS-COV-2与SARS-COV和MARS-COV有很大的相似性(图1)。 2)的情况。3.2. T淋巴细胞表位预测3.2.1. CTL表位表位在长期免疫的形成中起着关键作用。我们使用上述IEDB推荐的方法发现了7个CTL表位。几个免疫过滤器被用来找到这些周期性边界条件(PBC)用于所有X,y,z最佳表位(表2)。 所有的表位,以及它们的S. Al Zamane等人医学信息学解锁27(2021)1007816-图二、 人冠状病毒表面、膜和囊膜蛋白家族的进化关系。定位、抗原性和结合等位基因记录在表1中。3.2.2. HTL表位利用SMM方法,分选10个HTL表位(表3)。然后使表位通过几个免疫过滤器并检查其诱导能力(表4)。在每个表位内,其显示至少两种细胞因子的诱导能力(表4)。3.3. 线性B细胞表位已基于抗原性选择混杂表位用于鉴定线性B细胞表位(阈值0.4)。进一步检查表位的变应原性和致敏性(表5)。我们发现5个LBL高抗原性表位的范围在10至26个氨基酸序列之间(表5)。最后,通过pymol软件将LBL、HTL和CTL表位的位置可视化到表面、膜、包膜蛋白的3D结构中(图1B)。 3 A、B、3C)。3.4. 多表位疫苗构建我们在适当的(AAY、GPGPG和KK)接头的帮助下组合了7CTL、10HTL和5LBL表位。最后,我们通过EAAAK接头连接佐剂完成了我们的疫苗构建。线性多表位疫苗的图形图在(图1B)中给出。 4).3.5. 最终疫苗的抗原性、致敏性和溶解度预测VaxiJen 2.0和ANTIGENpro服务器测定的疫苗抗原性分别为0.5466和0.860981(表S1)。此外,AllergenFP和AllerTOP v. 2.0服务器均预测其无过敏性(表S1)。构建体还显示可溶于SOLpro和蛋白质-溶胶服务器(图S1,表S1)。工程化疫苗的跨膜螺旋的状态在疫苗开发中是预期的(图1)。 S2)。此外,缺乏信号肽也意味着阻止蛋白质定位(图1)。 S3)。3.6. 理化性质鉴定疫苗构建体47.145 kDa(kDa)。理论pI 10.01证实了基本性质(等电点)。该疫苗的稳定性由28.26的不稳定性指数表示(小于40的得分指示稳定的蛋白质)。带正电荷和负电荷的疫苗残基的适宜量分别为14和60。估计哺乳动物网织红细胞(体外)的半衰期为30小时,酵母(体内)为>20 h,大肠杆菌> 10 h(体内)。80.62的脂肪族指数确保了热稳定性,而GRAVY等级0.134证实了疫苗3.7. 整个抗原的HLA等位基因的分布在世界各地的国家,地区和种族群体之间存在差异。因此,除了设计有效的疫苗外,还应考虑到人口覆盖率。分别和联合收集与所选CTL、HTL表位相关的等位基因(MHC-I、MHC-II)用于群体研究。欧洲、北美、东亚、南亚和北非的大陆覆盖率最高,而中美洲的覆盖率最低(数据S1,图5C)。欧洲国家在国别覆盖率方面位居榜首。然而,总的来说,它覆盖了世界人口的97.37%。在大流行到来之后,受影响最严重的国家是中国、意大利、西班牙、法国、伊朗和美国。因此,我们非常有兴趣澄清我们的疫苗覆盖率在这些国家的情况。研究显示,我们的疫苗分别代表了中国、意大利、西班牙、法国、伊朗和 美 国 人 群 的 93.29% 、 98.62% 、 92.85% 、 98.95% 、 96.15% 和98.46%。在所研究的种族群体中,欧洲高加索种族群体显示出最高的组合人口覆盖率(99%),而亚洲和美洲种族群体具有超过90%的覆盖率(数据S1,图5 B)。我们核实了S. Al Zamane等人医学信息学解锁27(2021)1007817表1MHC-I表位及其结合等位基因(IC50 500 nM)。<表1(续)CTL表位位置等位基因IC50抗原性(vaxijen v2.0)(902-911)2.FASVYAWNRK S(347-355)3.WTAGAAAYY SA*68:02,HLA-A*02:06,HLA-A*02:03,HLA-A*30:01,HLA-A*02:01 HLA-A*68:01,HLA-A*33:01,HLA-A*68:01,HLA-A*30:01,HLA-A*31:01,HLA-A *11:01,HLA-HLA-表2HLA-A*02:01,HLA-A *02:06,HLA-A *02:06,HLA-A *02:06,HLA-A *02:01,HLA-A *02:01,HLA-A *02:03,HLA-A*02:03,HLA-A*68:02,HLA-A*02:03,HLA-A*30:0114.5420.9229.7148.4363.3199.07107.14117.92344.55381.92(258-266)A*30:02,HLA-A*26:01,HLA-B*35:01,HLA-A*68:01,HLA-B*15:01,HLA-A*01:01,HLA-最终选择的CTL表位片段的结果CTL表位长度免疫原性致敏性1.MAYRFNGIGV100.3226非过敏原非至Xin2.ASFRLFARTR 100.29647非过敏原非至Xin3.LVIGAVILR 90.2601非过敏原非至Xin4.FASVYAWNRK100.25563非过敏原非至Xin5.SVLLFLAFVV 100.24819非过敏原非至Xin6.WTAGAAAYY 90.15259非过敏原非至Xin7.KLNDLCFTNV 100.0961非过敏原非至Xin4.KLNDLCFTNV SB*58:01,HLA-A*68:02238株SARS-COV-2基因中CTL和HTL表位的保守性如前所述,其基因组数据从GSAID数据库获得的序列。 为了评估保护区,我们注意到所有的HLA-(386-所选表位几乎跨越了序列间100%的保守性。3.8. 最终疫苗的二级和三级结构鉴定从二级结构预测中,我们观察到137(44%)、102(23%)和193(31%)个氨基酸序列参与α-螺旋、β-折叠和无规卷曲的 产 生(图13)。 S4,Fig. S5)。所计算我们建模的三级结构的RMSD值为11.391,5.ASFRLFARTR M(986.LVIGAVILR M(138CTL表位位置等位基因IC50抗原性(vaxijenv2.0)1.MAYRFNGIGVSHLA-22.871.352339.5357.0575.33108.7615.610.586834.6876.73105.43139.79176.32218.7058.810.630678.4583.10141.41244.91248.63370.94394.0923.782.692750.0662.36108.78121.03202.2826.330.623799.88192.30200.01256.43496.0216.350.5004100.11160.07403.69S. Al Zamane等人医学信息学解锁27(2021)1007818-7.SVLLFLAFVV E(16-25)A*02:03 HLA-A*31:01,HLA-A*31:01,HLA-A*68:01,HLA-A*33:01,HL
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- SSM动力电池数据管理系统源码及数据库详解
- R语言桑基图绘制与SCI图输入文件代码分析
- Linux下Sakagari Hurricane翻译工作:cpktools的使用教程
- prettybench: 让 Go 基准测试结果更易读
- Python官方文档查询库,提升开发效率与时间节约
- 基于Django的Python就业系统毕设源码
- 高并发下的SpringBoot与Nginx+Redis会话共享解决方案
- 构建问答游戏:Node.js与Express.js实战教程
- MATLAB在旅行商问题中的应用与优化方法研究
- OMAPL138 DSP平台UPP接口编程实践
- 杰克逊维尔非营利地基工程的VMS项目介绍
- 宠物猫企业网站模板PHP源码下载
- 52简易计算器源码解析与下载指南
- 探索Node.js v6.2.1 - 事件驱动的高性能Web服务器环境
- 找回WinSCP密码的神器:winscppasswd工具介绍
- xctools:解析Xcode命令行工具输出的Ruby库
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功