没有合适的资源?快使用搜索试试~ 我知道了~
医学信息学解锁25(2021)100670计算机模拟分析显示SARS-CoV-2 C241 T变异体与宿主复制因子MADP 1和hnRNP-1的转录效率较低[10]杨文,杨文. 纳撒尼a,Shantanu Shuklab,Dhaval Patel c,Chirag Patel d,Madhvi Joshia, *,Chaitanya G.Joshia,**aGujarat Biotechnology Research Centre(GBRC),Sector- 11,Gandhinagar - 382011,Gujarat,IndiabGenome Science and Technology,The University of Tennessee,Knoxville,TN-37996,United Statesc印度古吉拉特邦Gandhinagar印度高级研究所生物信息学和结构生物学系,邮编:382426d古吉拉特大学科学学院植物学、生物信息学和气候变化影响管理系,印度艾哈迈达巴德,A R T I C L EI N FO保留字:MADP 1hnRNP15′ UTRC241TSARS-CoV-2蛋白质-RNA复合物MD模拟MMPBSAA B S T R A C T新型严重急性呼吸道综合征-冠状病毒-2(SARS-CoV-2)已在全世界夺去了330多万人的生命,而且仍在继续。根据GISAID数据库,SARS-CoV-2的基因组学已得到广泛研究,每天提交500多个基因组。在SARS-CoV-2基因组内的几个热点突变中,最近的研究主要集中在错义变体上。此外,显著较少的注意已经给予描绘的作用,非翻译区(UTR)的SARS-CoV-2基因组中的疾病进展和病因。SARS-CoV-2基因组中最常见的5' UTR变体之一是C241T,全球频率超过95%。在本研究中,C241 T突变的影响进行了研究相对于RNA结构的变化及其与宿主复制因子MADP 1锌指CCHC型和RNA结合基序1(hnRNP1)的相互作用。分子对接和分子动力学模拟结果表明,C241T突变体茎环与宿主转录因子MADP 1的相互作用减弱,复制效率降低。这一结果还与全球SARS-CoV-2病例的康复率增加和死亡率降低1. 介绍COVID-19大流行已影响全球超过4000万人,并已导致近300万人死亡[1]。SARS-CoV-2是一种属于冠状病毒科的ssRNA病毒。这个病毒家族包括致命病毒,如SARS,MERS和SARS-CoV-2,它们会导致呼吸道感染[2]。最初病毒感染后的宿主-病原体相互作用导致宿主和病原体之间的生存斗争,并可能导致使一方占上风而另一方灭亡的反机制。大多数ssRNA病毒通过5 '帽包含其基因组复制,对于病毒复制,5′非翻译区(UTR)通过作为调节RNA病毒(特别是小RNA病毒)中各种宿主复制起始因子的主要杠杆而做出实质性贡献[5]。另一种机制涉及非AUG(甲硫氨酸)起始,其中病毒靶向真核起始因子-2(eIF 2),抑制宿主细胞蛋白质合成。此外,一些病毒使用CUG(亮氨酸)起始模式来克服特定抗原肽的应激[6]。此外,一些病毒采用翻译起始的替代方案,如eIF2非依赖性关闭机制,由此这些病毒利用起始密码子后下游螺旋的形成来有效翻译病毒mRNA [7]。这些是病毒利用宿主因子进行复制和翻译的一些最重要的机制。因此,这些靶标可以通过关闭病毒翻译机制来有效预防病毒感染[8]。SARS-CoV-2可能通过5′帽依赖性机制进行复制[9]。非结构蛋白16(nsp 16)与Nsp 10结合形成异二聚体,其对病毒在宿主中的增殖执行两个重要功能,一个是使病毒编码的mRNA的5′端甲基化,另一个是使病毒mRNA的第一个核苷酸2′O-甲基化[10]。SARS-CoV-2通过缔合进入人类宿主后* 通讯作者。** 通讯作者。电子邮件地址:madhvimicrobio@gmail.com,jd1-gbrc@gujarat.gov.in(M。Joshi),dir-gbrc@gujarat.gov.in(C.G. Joshi)。https://doi.org/10.1016/j.imu.2021.100670接收日期:2021年6月11日;接收日期:2021年7月7日;接受日期:2021年2021年7月21日在线提供这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表医学信息学期刊主页:www.elsevier.com/locate/imuA. Chaudhari等人医学信息学解锁25(2021)1006702-与ACE2(血管紧张素转换酶)受体结合,进入肺上皮细胞并将其RNA注入宿主细胞质[11,12]。全长负义RNA拷贝在感染的初始阶段产生,其进一步充当合成正义基因组RNA的模板[2]。在病毒基因组的不连续复制过程中,RNA茎环(SL)结构SL 1、SL 2、TLR-S(翻译前导区)通过与宿主RNA结合蛋白如锌指CCHC型和RNA结合基序1 MADP 1相互作用而发挥重要作用。这些相互作用在病毒复制和翻译中起重要作用[13SARS-CoV-2的5′UTR具有各种茎环,报道为SL 1、SL 2、SL 3、SL 4A、SL 4 B和SL 5 [17]。关于SARS-CoV-1,SL 1包含一个可能参与病毒RNA与宿主蛋白相互作用的微调的二分序列。在大多数冠状病毒物种中,SL 2含有高度保守的5′-CUUCU(N)-3′环序列,其可能形成四环状结构[18,19]。SL3在γ和β冠状病毒组中是保守的。SL 3包含TRS-L(转录调节序列)5′-UCUCAA-3′,其暴露在SL 3的核心区域中,并且意味着高度参与病毒复制和转录[20]。SL 4是冠状病毒中主要的发夹环结构域之一,位于TRS-L序列的下游,易于发生突变。甚至SL4中的单个或双SNP也可以改变序列的框架并可以减少病毒复制[18,21,22]。SARS-CoV-2的基因组序列约为29-31 kb,全球研究人员已将超过151,000个全基因组序列保存在GISAID(全球共享所有流感数据倡议)中。SARS-CoV-2基因组中的顶级变异包括高频变异,包括C241 T,C1059 T,C3037 T,C14408T,A23403 G,G25563T 和 G28883C , 其 中 C241T 变 体 到 2020 年 10 月 的 频 率 为99%,熵为0.505 [23]。尽管已经对基因组的错义变体进行了大量研究,但据我们所知,没有关于5' UTR变体C241 T对宿主因子结合的影响的研究还表明,刺突中的突变有助于病毒逃避免疫逃避[25,26]。但死亡率的总体下降和再加工率的增加可能是由于一些有利于宿主免疫系统的突变[27]。参与冠状病毒增殖的宿主因子包括调节IBV(免疫支气管炎病毒)移码的膜联蛋白A2 [28]、高亲和力结合RNA TLR-s前导序列MHV()链的hnRNP 1、结合BCov、TBV和TEGV 3′UTR多聚A区的PAPB [29-这些因素的参与通过涉及体外下拉测定和基因表达研究的湿实验室实验来证明[13,32]。最近,据报道病毒nsp1通过与5′ UTR本文利用SARS-CoV-2野生型(241 T)和突变型(241 C)5′ UTR序列与宿主因子MADP 1和hnRNP 1进行分子对接和分子动力学模拟,研究病毒毒力的影响。此外,通过解释H-键的形成、使用MMGBSA、MMBPSA、动力学互相关矩阵和主成分分析的结合能,比较野生型和突变体RNA-蛋白质复合物的稳定性。总之,这项工作有助于建立宿主因子与病毒5′ UTR茎环的相互作用,并了解C241 T突变对SL1,SL2,SL3,SL4A,SL4B和SL5相对于宿主因子的动力学的影响。2. 材料和方法2.1. RNA二级结构预测RNA二级和三级结构预测对于在计算机模拟实验中获得准确的结论非常重要。从Rfam(RNA sequence family)数据库中检索野生型SARS-CoV-2的5′UTR的FASTA序列,其参考ID为RF 03117,并用于预测其二级结构。使用野生型序列通过用尿嘧啶(U)替换位置241处的胞嘧啶(C)手动产生突变RNA序列,尿嘧啶(U)在本文中被称为C241T。各种SARS-CoV-2的菌株已经报告了RFAM数据库中记录的各种茎环结构和凸起的存在;我们从RFAM数据库(id RF 03117)下载了FASTA序列(约300个碱基对),用于研究β冠状病毒的5′UTR序列[34]。使 用 独 立 和 基 于 网 络 的 程 序 ( 如 3DNA 、 X3-DNA-DSSR 和 RNAcomposer)生成RNA 3D结构[35在基于3DNA的mut_RNA平台中通过C241T产生RNA序列突变[35]。对于RNA,在RNA composer中生成二级和三级结构,该RNA composer使用RNA FRABASE字典和CHARM力场生成有效的最小能量RNA结构[37]。RNA合成器的一个优点是易于预测长RNA序列的三元结构,这是许多RNA结构预测软件的局限性。在mutaRNA中检查了单核苷酸变异对碱基配对概率的影响[38]。在基于X3DNA-DSSR LinuX的操作系统中确认折叠RNA结构的最终确认,该操作系统给出预测序列和实验验证序列之间的准确均方根偏差(RMSD)。2.2. RNA-蛋白质结合位点由于MADP 1与SARS-CoV-2的SL 1结合,因此选择该区域作为5′UTR区域的潜在蛋白结合位点此外,由于还已知TRS-L与hnRNP 1序列5′ CGGCUGC 3′结合,因此选择该序列作为蛋白结合序列[3,13]。RNA残基与蛋白质结合的预测也通过RNApin网络服务器进行[39],其中上述位点也落入蛋白质结合区域。2.3. 蛋白质-RNA复合物在HADDOCK 2.2中进行宿主因子和RNA的分子对接[40,41]。HADDOCK使用数据驱动的方法执行对接。对接包括三个步骤:刚体对接、半柔性细化和水细化。在蛋白质和RNA以其结合构象对接的第一阶段中,使用程序的默认设置生成总共1000个结构180个旋转的解决方案的系统采样用于刚体对接,以尽量减少假阳性的发生。从刚体对接产生的最好的20%的结构被用于半柔性细化的第二阶段。半柔性细化分三个阶段进行,其次是刚体扭转角动态,并在不同的MD步骤的模拟退火阶段。在最后的模拟退火阶段,其中1000 MD步骤进行从300 K到50 K与2 fs的时间步长。在最后阶段,除了RNA的末端碱基外,位于界面处的蛋白质残基的侧链和骨架都可以移动该最后阶段包括在8 μ m TIP3P水分子壳中的温和精制(100、200和300 K下的100MD加热步骤,随后是300 K下的750个取样步骤和300、200和100 K下的500 MD冷却步骤,所有时间步长均为2 fs)[41]。蛋白质-RNA复合物的对接也在各种服务器如PATCHDOCK [42]、NPDOCK [43]和HDOCK [44]中进行,以比较两种结构之间的对接得分2.4. 分子动力学模拟MADP 1与SL1、SL2区结合,并与覆盖SL3区的残基结合。SL 4和SL 5的动力学似乎对于影响宿主因子与SL 1、SL 2和SL 3的结合非常关键A. Chaudhari等人医学信息学解锁25(2021)1006703+.)-SL 3。C241 T突变影响SL4。我们在最近更新的力场OPLS4和Amber中进行了无偏模拟,以在MADP 1结合和两种RNA变体之间的亲和力方面符合每个茎环的整体动力学。蛋 白 质 -RNA 复 合 物 的 分 子 动 力 学 模 拟 在 Desmond 中 进 行 , 在Schrodinger中实施[45,46]。选择首先将蛋白质-RNA复合物加入到TIP 3 P水盒中,延伸超过复合物的任何原子10 μ m添加抗衡离子(Na+和Cl-离子)以中和电荷。 盐浓度设定为0.15 M钠离子和氯离子,以适应生理条件。MD在NPT系综中在以下温度下进行:310.5 K和1.00 bar压力超过100 ns,能量记录间隔为1.2 ps,轨迹记录间隔为24 ps模拟盒X包含~331,德斯蒙德轨道中的517个原子,体积为BOX大小(103)3413425. 模 拟 使 用 最 新 的 OLPS4 和 OPLS3e 力 场 运 行 在 PyMOLDeLano,W.L. 2009年在Gromacs(版本2018.1)中对MADP 1-WT复合物进行了额外的MD模拟[47]。蛋白质和RNA拓扑结构是用琥珀力场构建的[48]。在由~1979400个原子组成的矩形盒中,使用三位点TIP 3 P水模型模拟MADP1-RNA复合物。BOX构型在所有方向上设置为与RNA的边缘相距1nm。随后,加入等量的抗衡离子Na /Cl-以中和系统的总电荷。使用LINCS al-出租m [49]限制粘合长度。使用最速下降算法进行能量最小化,以消除任何空间冲突和不良接触(最多50,000步)。颗粒网格埃瓦尔德(PME)求和用于计算长程相互作用,截止值为1 nm [50]。最小化之后是位置限制蛋白质-RNA复合物。ΔGSolv是蛋白质-RNA复合物的GBSA溶剂化能与蛋白质和RNA的溶剂化能之和的差。ΔGSA是复合物的表面积能与蛋白质和RNA的表面积能之和的差。还使用MM-PBSA方法计算来自Gromacs的轨迹的结合能,使用MmPbSaDe-comp.py和energy 2bfac计算残基内的残基分解和能量分布 [55]。2.6. 主成分分析通过对笛卡尔坐标数据集的协方差矩阵的分析,得到了蛋白质-RNA复合物中原子的主要相关运动的生动的图形表示。生成坐标i和j的元素Cij的协方差矩阵X由下面提到的公式给出。Cij=( ri- ri) * rj- rj其中,ri和rj分别为第i个和第j个Cα原子的笛卡尔坐标,τri和τrj分别为分子动力学模拟得到的所有构型的时间平均值。使用R中实施的Bio 3D文库进行该分析[562.7. 动态互相关矩阵利用互相关矩阵分析了C241 T突变对蛋白质-RNA复合物动力学的影响。通过下式由Cα原子计算交叉相关系数Cij使用NVT(常数[N]、常数体积[V]和常数Cij=.Δri*Δrj )温度[T])和NPT(恒定数量[N]、恒定体积[V]和恒定温度[T])。Berendsen恒温器算法用于在基于NVT的平衡中保持300 K的恒定温度[51]。NVT平衡后,使用Parrinello Rahman恒压器在恒定压力(1 bar)下进行NPT平衡100 ps [52]。VMD和UCSF-嵌合体用于MD轨迹的可视化[53,54]。Gromacs分析脚本g_rmsd和g_rmsf用于绘制系统内整个轨迹的均方根偏差(RMSD)和均方根波动(RMSF)。VMD用于分析氢键,供体-受体值具有3 μ m截止值和30μ m截止值。Xmgrace用于绘制图形(https:plasma-gate.weizmann.ac.il/Grace/)。将野生型RNA和C241T突变体分别与两种不同的宿主因子MADP 1和hnRNP1对接,共得到4种复合物。在我们的研究中,MADP 1是我们的主要关注点,因为已知它结合SARS-CoV-2 5′ UTR区域。MADP 1-RNA复合物在Schrodinger的OPLS 4和Gromacs的AMBER力场中模拟两次。而hnRNP 1-RNA复合物仅在Schrodinger中模拟。在所有10个复杂的模拟为100 ns?2.5.使用以下公式使用Schrodinger中的PRIME模块使用热_mmgbsa.py和残基分解使用breakdown_mmgbsa_by_resdiue.py脚本计算四种蛋白质RNA复合物的结合能。从MD轨迹计算相等间隔的1000个构象的结合能。ΔGBind= ΔGSA+ ΔGSolv+ ΔEMMΔGSA是蛋白质- RNA复合物的表面积能量与蛋白质和RNA的表面积能量之和的差。ΔEMM是最小化能量之间的差异,Δri在这个方程中,Δri和Δrj分别是第i个和第j个残基(或原子)的平均位置的位移。尖括号“X”表示整个轨迹的时间平均值。Cij的值为1至1。正值被分配给以青色指示的正相关运动原子(在相同方向上移动),并且负值表示以品红色指示的负相关运动(在相反方向上移动)。使用R的Bio3D软件包进行DCCM分析[563. 结果讨论&病毒复制高度依赖于宿主因子,尤其是RNA病毒的转录因子新型SARS-CoV-2是冠状病毒科的一种正链RNA病毒,在人类宿主体内进行5′本研究利用病毒基因组中最常见的5'非翻译区突变C241T,研究了两种人类转录因子MADP 1和hnRNP1的分子动力学和相互作用。先前关于SARS-CoV-1感染的报道,来自锌指蛋白基序1的MADP 1在决定宿主细胞内的复制效率方面起着非常关键的作用[16]。而另一种转录因子hnRNPA-1在SARS-CoV-2中被广泛研究,在病毒增殖中具有多种作用,如RNA复制,转录,输出,输入和翻译。hnRNP-1使用RGG(精氨酸-甘氨酸-甘氨酸)基序进行RNA结合;它还与病毒核衣壳蛋白(N)结合[60]。虽然hnRNP 1与大多数冠状病毒(如TGEV和MHV)的TLRS序列(富含嘧啶)结合[3],但其在SARS-CoV-2中的作用尚待研究。MADP 1和hnRNP1与超置换RMSD 1.54 bp具有高度的结构相似性(补充图S1)。由于hnRNP 1的三级结构和在结合其他冠状病毒的TLR-s中的作用的相似性,导致我们将该蛋白质结合到我们关于结合SL 3中存在的TLR-s的由于实验数据A. Chaudhari等人医学信息学解锁25(2021)1006704±±-- --可用于MADP 1相互作用的SL1和SL2区域内的SARS-CoV-1的5′UTR,基于选择这些区域内的残基进行对接。在本研究中,由于SARS-CoV-1的已发表数据,主要关注MADP 1在5′ UTR内的相互作用,而没有关于SARS-CoV-1和SARS-CoV-2中hnRNP-1相互作用的实验数据。已知HnRNP1在TLR-s处结合其他冠状病毒,并且它们在TLR-s处共享相似的序列,因此假设hnRNP 1也可能在病毒转录方面起重要作用。在两个不同的力场中进行关于MADP 1的模拟,在Schrodinger 2021.1中释放的OPLS 4和在Gromacs 18.1中释放的AMBER99SB,以探索突变在亲和力方面的影响,并且茎环SL 1、SL 2、SL 3的动力学在与宿主因子结合或不结合方面相同。由于两个原因,模拟重复进行。第一,检查系统稳定性方面模拟数据的可重复性。第二,了解宿主因子MADP 1从突变体RNA上的解离是否实际上是一种观察到的现象,或者仅仅是Desmond运行中的人为现象。在hnRNP1的情况下,仅在薛定谔中进行模拟。3.1. SARS-CoV-2基因5′ UTR区结构差异分析野生型和突变型(C241 T)病毒5′ UTR序列的核苷酸序列取自GenBank登录号MN908947.3,并生成二级结构(补充表S1)。使用点括号格式的X3-DNA-DSSR预测RNA二级结构[36],并在Varna-GUI中可视化数据,并解释C241 T引起的结构差异。此外,使用RNA composer生成5′ UTR的三级结构,以关联通过X3-DSSR获得的结果[37]。由SNP引起的RNA结构变化的表示在表1中阐明。与突变体相比,野生型RNA的碱基对数量减少了2个,这反过来也影响了整个5′ UTR序列中存在的螺旋、凸起和内环的数量。两种RNA结构的拓扑差异见补充图S2。而RNA茎-环的结构特征在图1中描述。在突变体RNA中,在SL-4中观察到一个主要变化(101 G-111 U至101 G-112 U),这进一步导致SL 4的环结构的变化(图1B)。SL 4的变化也改变RNA的三级结构;进一步诱导SL 1、SL 2和SL 3的几何结构差异(图1D和E)。两种RNA序列在SL 1、SL 2和TLR序列内均显示出结构和折叠差异(图1D-3D&1 E-3E)。 野生型RNA结构共享SL1、SL2和SL3的邻近几何结构,突变型RNA共享相同的远离几何结构SL1、SL2、SL3和SL4表1表格表示示出了在两个RNA序列中的结构差异的背景下X3-DNA-DSSR的输出。与突变体相比,野生型RNA序列在碱基对、凸起、内环和基于原子的加帽功能方面发生了变化上述参数的变化引起SL1、SL2和SL3折 叠 的 变 化 (如图1B所示)。 ①的人)。参数野生型突变体(C241T)核苷酸总数300300碱基对107109多胞胎总数88螺旋总数87股骨柄总数1717G-U摆动对78原子-碱基帽相互作用910分开的二核苷酸3333合并为单元1515发夹环77凸起总数35内部循环65连接总数11非环单链片段总数66扩展A小调(X型)基序33似乎形成了一个用于结合转录因子的空腔。基于输出,使用X3-RNA-DSSR以点括号形式生成的二级结构与代表茎环和螺旋的相同报告的实验数据完全匹配[20,22,32]。为了将RNA结构中的这些变化与宿主转录因子的有利或不利结合相关联,计算蛋白质-RNA对接和所得结合能以鉴定野生型和突变体(C241 T)RNA序列之间的结合效应。3.2. 宿主转录因子与5′ UTR变异体的对接已知MADP 1在Nsp 1蛋白的帮助下结合RNA的SL1和SL2,用于病毒复制和转录[16]。已知另一种蛋白质hnRNP 1结合在IBV、TGEV和MHV的TLR-S序列处[3]。MADP 1与SARS-CoV-1的5′UTR结合的体外研究是可用的,但没有hnRNP 1 [16]。SARS-CoV-2的5′UTR折叠,使得SL 1、SL2、SL 3和SL 4共享相邻折叠,这可能增加了这些蛋白的结合表面积。我们主要关注MADP 1介导的5′ UTR区域两种变体的SL 1和SL 2区域的结合,因为在SARS-CoV-2中进行了确证性的体外研究。在大多数冠状病毒科病毒中,已知hnRNP 1结合于5′ UTR的TLR-S序列[13,30]。推测hnRNP 1也可能与SARS-CoV-2的TLR-S结合,促进病毒增殖。在对接研究后,还观察到宿主因子与两种RNA序列结合的变化。此外,还分析了宿主因子-RNA复合物的稳定性,以比较两种5′ UTR变体之间的亲和力。野生型和突变体RNA与来自HADDOCK的宿主因子蛋白的对接结果描绘了RNA三级结构中茎环SL 1、SL 2和SL 3折叠的变化,这反过来介导了所有四种复合物内结合的差异。对于MADP 1,在HADDOCK中,野生型复合物的8个簇中共有117个结构,代表水精制模型的58.5%,而突变序列(C241T)的8个簇中产生119个结构,代表水精制模型的59.5%.对于HNRNP1,HADDOCK将107个结构聚类在13个簇中,这代表了野生型复合物生成的水精制模型的53.5%,而14个簇中的92个结构,这代表了突变体复合物生成的水精制模型的46.0%。基于对接得分,野生型RNA显示出具有更好的具有高结合常数值(更负)的结合概况,143.0 ± 3.5,与突变复合物138.4 ± 1.6相比,以及MADP 1的RMSD值为0.9 ± 0.6,与突变(C241 T)序列为1.1 ± 0.7相比(详见表2MADP 1与RNA结构的结合位姿如图2所示。如图2E和F所示,与突变的复合物相比,MADP 1覆盖SL1、SL2和SL3的更高部分用于结合。这些区域内的氢键形成也显示与图2A和B中所描绘的突变复合物(H-键:14)相比,野生型复合物(H-键:17)中MADP 1的更好结合。对于hnRNP1,对接评分和RMSD值未观察到显著变化。然而,与具有1.5的突变体相比,具有宿主因子的野生型RNA-2.5的簇之间的平均标准偏差(负Z分数)指示复合物之间更好的对接。(表2)。对接结果清楚地说明静电能和范德华能有利于蛋白质-RNA复合物的形成,而去溶剂化能则阻碍了复合物的形成。对接姿态相对于两个主机因素如图所示。二、还在NP Dock、H-Dock和PATCH Dock等各种平台中进行对接(补充表:2)。基于从HADDOCK和其他对接平台获得的对接评分,野生型RNA与突变体RNA相比显示出更好的结合为了进一步验证这些发现,研究了WT和MUT蛋白-RNA复合物的分子动力学,以发现结合能和稳定性。Fig. 1. SARS-CoV-2野生型和突变体C241 U(C241 T)5′UTR的结构变化A:显示野生型和突变体(C241 T)之间碱基对概率差异的差异热图。暗红色(橙色)表示突变诱导的配对电位降低(增加)。B. 在X3 DNA-SSR中生成的RNA 2D结构模型用于评估发夹环、凸起、茎环、多重体、摆动碱基对的数量、扩展的A-次要(X型)基序等等。由于SNP C241U引起的差异在表1中阐明。C. 左视图显示股骨柄环的整体几何结构变化,两个序列的5′UTR。RNA骨架以红色显示,而核苷酸腺嘌呤(A)、鸟嘌呤(G)、尿嘧啶(U)和胞嘧啶(C)分别以红色、绿色、蓝色和黄色显示。Cl:野生型RNA的左视图。C2:突变体RNA的左视图。D. 野生型RNA的主视图。D2:主视图,由野生型RNA的X3-DSSR生成,其中SL 1和SL 3共享附近的几何结构。E. 野生型RNA的主视图。E2:突变体RNA的X3-DSSR生成的主视图,其中SL 1和SL 3共享远离彼此的几何结构。A. Chaudhari等人医学信息学解锁25(2021)1006705±±±±A. Chaudhari等人表2医学信息学解锁25(2021)100670野生型与突变体RNA与宿主蛋白相互作用的分子对接概况。与突变体相比,野生型复合物关于两种宿主转录因子的HADDOCK评分更负。从对接获得的参数清楚地表明,在两种宿主因子MADP 1和hnRNP1的情况下,野生型复合物对我来说似乎比突变体蛋白质-RNA复合物研究中使用的群集黑线鳕评分簇大小范德瓦尔斯能量静电能去溶剂化能抑制违规能量内埋表面积Z-评分野生型MADP1突变体(C241T)MADP 1集群-2143. 0±3.5第3组138.4±1.6370.9±0.6231.1±0.7-88.8±8.6-459.4±22.526.6±1.1110.5±41.672277.5±86.71.8-75.3±12.7-519.7±74.5 33.2±3.676.7±31.342389.6±183.21.4野生型hnRNP1突变体(C241T)hnRNP-1集群-479.7±3.699.3±0.2集群-178.3±5.0129.4±0.2-40.0±5.6-335.3±26.9 18.5±5.588.8±19.911413.4±165.72.4-47.4±3.1-248.0±6.0 9.7±5.189.5±29.661348.1±86.81.53.3. 通过分子动力学模拟,宿主因子亲和力相对于RNA变体中茎环动力学的变化在HADDOCK中进行分子对接后,对两个具有不同宿主转录因子MADP 1和hnRNP1的5'UTR变异体(C241T)进行分子动力学(MD)模拟。对四种复合物进行了100 ns的MD模拟,因为在98-99 ns(ns)时观察到MADP 1与突变体(C241 T)的早期解离突变体复合物的早期解离是两种变体中RNA-蛋白质复合物稳定性的重要因素之一。SL 1和SL 3内空腔的变窄显著影响MADP 1的结合,这进一步导致RNA-蛋白质复合物的早期解离。在Schrodinger的模拟事件分析包中的野生型和变体两者的模拟事件期间捕获的各种图描述于图1A和1B中。4和5. Gromacs轨迹数据在Xmgrace软件包中绘制。与 相对于 MADP 1,RMSD(均方根 偏差)野生型的复合物为3.89 ± 1.18nm,突变型的复合物为5.181.57 0PLS4力场中的nm。在野生型RNA-蛋白质复合物的情况下,前20 ns的轨迹是波动的,但在30 ns后系统达到平台,表明MADP 1-RNA复合物已经形成稳定的结构。虽然观察到突变体复合物的轨迹在60 ns左右波动和稳定,平均RMSD波动为(图1)。 3 A)。 如图图3中,SL 1-SL 3的取向对于野生型复合物显示为灰色,对于突变体复合物显示为粉红色。从OPLS 4轨迹可以清楚地看到,野生型复合物在整个模拟过程中具有MADP 1与SL 1-SL 3的相互作用,而突变体显示出明显较少的相互作用或仅显示出SL 1内的关键结合 图图2 E和F以及,在0ns处的初始结构和甘草中的蛋白质显示,以显示初始结构中MADP 1覆盖的差异区域。可以看到,与突变体复合物相比,野生型中SL 1相对于MADP 1结合的取向更有利从10 ns到100 ns,野生型复合物中的黑色箭头表示模拟过程中茎环的动力学方向(图:3A)。观察到突变C241 T的SL 4的动力学对于在野生型复合物周围产生这种增强空腔是重要的,这在RMSF中进一步阐述问题研究在模拟结束时,突变体复合物的两个复制品都具有显示分离(补充视频2和3)。通过AMBER99SB获得的RMSD值如图所示。 3B、野生型和突变型复合物分别为3.86、0.78和5.730.89 nm分别。在0ns时的初始结构对于两个力场是相同的,如图所示。 2 E和F。 图 3B,SL3和SL1也遵循在Opls4中观察到的相同动力学。随着模拟的进行,SL1和SL3在宿主因子(madp1)周围产生了一个空腔,这进一步增强了MADP 1相对于野生型RNA的亲和力在在相同的时间段75 ns,突变体复合物形成了结合腔,其不如野生型复合物紧密。在图3B中,与突变体RNA相比,MADP 1在野生型RNA中覆盖更多的表面积。这些发现可能与另一个柄袢SL4和SL5的总体动力学相关。SL 4和SL 5的动力学影响MADP 1与SL 1 -3的结合,这通过用于运动模式分析的RMSF、PCA和豪猪图显示(图11)。 4).图3A显示了野生型和突变体复合物在OPLS 4力场方面绘制的RMSD,其对蛋白质是特异性的。RNA结构在薛定谔轨道上以较高的速率波动,这可能导致RMSD增加,但系统在~80 ns?蛋白质和核酸在两种不同力场中的不同行为可能导致这种行为轨迹。主要目的是证明C241T突变在两种不同力场中的作用。从两种力场来看,C241T突变影响5′ UTR的变化,导致5′ UTR与宿主转录因子的稳定性降低计算来自两种复合物的MADP 1和RNA的RMSF(均方根波动)值。图4A解释了两种复合物中MADP 1残基的波动,其中与突变体(C241T)复合物相比,野生型复合物中1至60个氨基酸残基显示出较小的波动。RMSF值的波动较小表明RNA-蛋白质复合物之间的相互作用更大(49,50,51),这在野生型复合物的情况下也是明显的。波动较小的残基实际上与RNA相互作用,这在氢键分析部分中进一步讨论。在图4A中,示出了MADP 1的残余动力学互相关网络,浅紫色示出了相对于RNA变体的相关运动,红色示出了相对于RNA变体的反相关运动。在突变体中,与野生型相比,MADP 1显示出更少的相关性和更多的反相关运动。此外,豪猪图与RMSF图匹配。在豪猪图中,蓝色箭头表示低,而红色表示高,白色箭头表示中等原子位移。图4A、1a和1b(也包括2a 和2 b)显示红色箭头,并显示高RMSF值。而突变体中的Ib和Id以及野生型中的2b和2d显示(蓝色)低原子位移,覆盖低RMSF值。 在AMBER 99SB,图4C,野生型中的MADP 1在覆盖残基1 - 10(1a)和50-55(1b)的区域中显示高原子置换,显示豪猪图中箭头的长度增加。突变体复合体显示叙述了2a区和2b区原子的高位移在RMSF图中也是如此。在来自两种变体的RNA的情况下观察到相同的结果。在图5B和D中,分别显示了Opls4和AMBER99SSB中RNA变体的RMSF。现在可以清楚地看到SL 4和SL 5的动力学如何影响MADP 1与SL1-SL 3的结合。 图豪猪图SL 4的5D和1b(野生型)和2b(突变体)在野生型中显示出均匀的衍射,而在突变体中SL 4显示出高度干扰的运动,这可以直接影响MADP 1与SL 1-SL 3的结合,因为所有茎环都是互连的并且是一个RNA结构的一部分。从图1c和2c的区域可以进行相同的观察。 5个D.6图二. MADP 1-RNA和hnRNP 1-RNA复合物的HADDOCK生成的对接姿势。A B&:在茎环区域具有关键相互作用的MAPD 1-野生型RNA复合物。MADP 1与野生型和突变型RNA的SL1、SL2和SL3区域内的RNA残基之间存在界面氢键和堆积相互作用。RNA和蛋白质残基野生型RNA以蓝色和海洋色显示。与MADP 1相互作用的RNA残基(以橙色条显示)以紫色条显示。CD:&在SL 3中具有独特相互作用的hnRNP 1-WT RNA复合物。RNA以石灰色显示,蛋白质以小麦色显示。与hnRNP1相互作用的RNA残基(以绿色棒状物显示)以橙色棒状物显示。E F:关于MADP 1的野生型复合物和突变体复合物。MADP 1在表面表示中以洋红色RNA以深蓝色的卡通形式显示A. Chaudhari等人医学信息学解锁25(2021)1006707图三. RMSD从在OPLS 4和AMBER 99 SSB中模拟MADP 1-RNA复合物获得。野生型RNA以灰色显示,突变体RNA以粉红色显示。MADP1显示为绿色。黑色箭头描绘了与MADP1A相互作用时茎环的方向。在两个力场中,与突变体复合物相比,野生型复合物相对于MADP 1显示出较低的RMSD值。透明灰色区域显示通过重复模拟获得的标准误差。在两种RNA中,SL 1、SL 2和SL 3的动力学变化不同,这在术语上影响对MADP 1的结合。在野生型RNA中,它显示与SL 1、SL 2和SL 3相互作用;而在突变体中,它仅显示与SL 1和SL 2相互作用。B. 由于各种茎环的动力学影响MADP 1与RNA的结合,因此在Gromacs中也观察到Schrodinger中MADP1在野生型复合体中显示与茎环1、2和3的强相互作用,而在突变体中仅显示与1和2的相互作用。A. Chaudhari等人医学信息学解锁25(2021)1006708见图4。复合物内MADP 1和RNA残基的RMSF。图4A:野生型复合物(蓝色)中MADP 1氨基酸残基的RMSF显示与突变体复合物(红色)相比在薛定谔中更低的残留波动。4 B:MADP-RNA复合物中SL 1和SL 2区域的RMSF在野生型复合物中显示出较低的波动,导致与Schrodinger中的突变体RNA相比,野生型RNA中MADP 1的有效或紧密结合。4C:具有Amber力场的Gromacs中MADP 1残基的RMSF。4D:Gromacs Amber力场中RNA残基的RMSF,其中以更紧密性结合MADP 1的残基再次显示野生型复合物中更低的残基波动。同样的事情也以豪猪图的形式显示出来。其中箭头的长度表示波动程度,箭头的方向表示波动方向。A. Chaudhari等人医学信息学解锁25(2021)1006709图五. 两个轨道都有氢键形成。5A:薛定谔中野生型和突变型复合物内的氢键形成(>3 π)。5B:薛定谔中野生型和突变型复合物内的氢键形成(>3 π)。图5C:使用PYMOL显示的MADP 1与野生型和突变体复合物在OPLS 4力场中的相互作用。5D:使用PYMOL显示的MADP 1与野生型和突变体在AMBER99SSB力场A. Chaudhari等人医学信息学解锁25(2021)10067010A. Chaudhari等人医学信息学解锁25(2021)10067011还分析了另一种宿主因子hn
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- SSM Java项目:StudentInfo 数据管理与可视化分析
- pyedgar:Python库简化EDGAR数据交互与文档下载
- Node.js环境下wfdb文件解码与实时数据处理
- phpcms v2.2企业级网站管理系统发布
- 美团饿了么优惠券推广工具-uniapp源码
- 基于红外传感器的会议室实时占用率测量系统
- DenseNet-201预训练模型:图像分类的深度学习工具箱
- Java实现和弦移调工具:Transposer-java
- phpMyFAQ 2.5.1 Beta多国语言版:技术项目源码共享平台
- Python自动化源码实现便捷自动下单功能
- Android天气预报应用:查看多城市详细天气信息
- PHPTML类:简化HTML页面创建的PHP开源工具
- Biovec在蛋白质分析中的应用:预测、结构和可视化
- EfficientNet-b0深度学习工具箱模型在MATLAB中的应用
- 2024年河北省技能大赛数字化设计开发样题解析
- 笔记本USB加湿器:便携式设计解决方案
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功