没有合适的资源?快使用搜索试试~ 我知道了~
沪公网安备31011502000118号原始软件出版物REMP软件在定点突变引物中引入筛选限制位点Madhavi Latha Yadav Bangaru(PhD)a,1,Ravi Kumar Medabalimib,1,SobhanBabu(PhD)b,Nidhanapati K. Raghavendra(PhD)a,a印度理工学院生物技术系,Hyderabad,Kandi,Telangana,502285,印度b印度理工学院海得拉巴计算机科学与工程系,邮编:502285ar t i cl e i nf o文章历史记录:收到2021年收到修订版,2021年10月14日接受,2021年保留字:定点突变Python 3沉默突变限制性位点DNA突变引物a b st ra ct允许限制性位点修饰的沉默突变的插入有助于在定点诱变期间筛选引入新的限制性位点需要分析突变引物内的简并序列。随着简并密码子总数的增加,分析变得越来越费力、耗时并且容易出错。为此,开发并描述了一个名为“REMP”(用于突变引物中的限制位点)的软件从输入序列,REMP瞬时产生具有长度为6-8个碱基对的限制性位点的简并序列输出序列基于与输入序列相比改变的碱基的数量来排列。REMP软件可以作为独立程序在不同的操作系统上安装和运行。REMP的任何用户都可以编辑该软件要考虑的限制性位点列表,而无需编写计算机代码或了解程序语言。版权所有©2021作者。由爱思唯尔公司出版这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)中找到。代码元数据当前代码版本v.1.1此代码版本使用的代码/存储库的永久链接https://github.com/ElsevierSoftwareX/SOFTX-D-21-00085Code Ocean compute capsulenone法律代码许可证MIT使用的代码版本控制系统无使用Python 3.7.6、tkinter、itertools的软件代码语言、工具和服务编译要求、操作环境依赖性任何可以运行Python 3.7.6如果有开发人员文档/手册链接问题支持电子邮件:sobhan@cse.iith.ac.in;raghunk@bt.iith.ac.in1. 动机和意义定点突变是指在DNA的特定位点上改变核苷酸核苷酸(nt)序列的改变可导致由DNA编码的氨基酸的改变(错义突变),或编码相同的氨基酸(沉默突变),或不编码任何氨基酸(无义突变)。缩略语:SDM,定点诱变; nt,核苷酸; bp,碱基对; Tm,解链温度*通讯作者。电子邮件地址:madhavib@iith.ac.in(Madhavi Latha Yadav Bangaru),cs18mtech11028@iith.ac.in(Ravi Kumar Medabalimi),sobhan@cse.iith.ac.in(Sobhan Babu),raghunk@bt.iith.ac.in(Nidhanapati K.Raghavendra)。1、同等贡献。https://doi.org/10.1016/j.softx.2021.100881突变)。在蛋白质的结构-功能分析中使用引起特定氨基酸到所需氨基酸的错义突变的SDM,并且该突变被称为所需突变。SDM可以使用各种方案[1除了期望的突变之外,突变体引物总是含有偶联的将筛选突变掺入突变体引物中以产生限制性消化模式,该限制性消化模式可以容易地区分具有所需突变的DNA与不具有所需突变的DNA。DNA的限制性消化模式的改变 一个新的限制性位点(回文序列)。在设计SDM的突变引物过程中,很少发现所需突变本身导致限制性位点的丧失或获得2352-7110/©2021作者。 由Elsevier B.V.出版。这是一篇开放获取的文章,使用CC BY许可证(http://creativecommons.org/licenses/by/4.0/)。可在ScienceDirect上获得目录列表SoftwareX期刊主页:www.elsevier.com/locate/softxMadhavi Latha Yadav Bangaru,Ravi Kumar Medabalimi,Sobhan Babu et al.沪公网安备31011502000118号2+++++在这种情况下,所需突变和筛选突变是同一个。通常,在所需突变附近的氨基酸的沉默突变是产生筛选突变所必需的。对于用作筛选突变的沉默突变,必须导致DNA的限制性消化模式的改变。沉默突变涉及用相同氨基酸的简并密码子取代氨基酸的现有密码子(由3nt组成)。不同的氨基酸具有不同数量(1至6个)的简并密码子。 对于长度为21 nt并编码7个氨基酸的DNA引物,简并密码子的总数可以在7至42的范围内。用于设计筛选突变的密码子分析在失去现有限制性位点和产生新限制性位点的情况下是不同的。失去现有的限制性位点是相对简单的,用相同氨基酸的简并密码子取代作为限制性位点一部分的密码子几乎总是达到目的。在鉴定出限制性位点后,在DNA引物序列中,可以手动替换其中的简并密码子并确保该位点丢失。然而,创造 新的限制性位点需要使用2 - 4个相邻氨基酸的简并密码子的组合产生回文序列。对于长度为21nt并且基于其编码的氨基酸的DNA引物,待生成和分析的简并序列的总数可以在2至279936的范围内。一种限制性位点,其可用于筛选所需突变的长度必须至少为6个碱基对(bp)。长度小于6bp的限制性位点或其中具有非特异性碱基(R、Y、X)的限制性位点产生不期望的大量不同长度的DNA片段,并且在产生可以区分携带所需突变的DNA与不携带所需突变的DNA的限制性消化模式方面是无效的。长度为6个碱基对(bp)的限制性位点(六聚体)可以跨越最少两个(6nt)和最多三个密码子(9nt),而长度为8bp的限制性位点(八聚体)跨越最少三个(9nt)和最多四个密码子(12nt)。通过手动产生和分析21 nt长DNA引物的所有简并序列来产生6 bp长的限制性位点可能是具有挑战性的、耗时的,并且需要足够的经验来避免错误。可以使用简并密码子从输入序列瞬时产生6- 8bp长的限制性位点的软件这样的软件可以使整个工作简单,耗时更少,效率更高,无论引物设计经验如何。互联网上有几种软件工具[5在给定核苷酸序列中引入沉默突变。这些工具分析所有三个开放阅读框(1、2和3 ORF)中的给定核苷酸序列,并产生长度范围为4至8 bp的限制性位点。因此,输出包括大量的序列,这些序列相对于编码蛋白质的ORF是框外的,具有小于6bp长的识别位点,并且携带远离所需突变的筛选突变。为了有效地设计携带所需突变和筛选突变的突变体DNA引物,生物学家需要一种软件,该软件在所需突变的任一侧上的20 nt内产生回文六聚体或八聚体限制性位点,并且不改变由引物序列编码的氨基酸。产生的回文序列必须是标准II型限制性内切酶的特异性识别位点,该酶在其识别位点内切割[9]。这样的软件将允许用户设计理想的突变体DNA引物,其具有朝向引物中间的期望突变,以用于稳定的扩增。引物与模板的结合,以及充分远离引物末端的筛选突变,以通过DNA聚合酶本文介绍的REMP软件程序是为生物学家设计理想的突变体DNA引物而开发的利用用户因此,来自REMP的输出序列具有与输入序列相同的ORF。REMP使用由用户指定的1个ORF指示的氨基酸的简并密码子生成输入引物序列的简并序列。在简并序列中,输出中显示了具有与市售限制性酶的6和8bp长识别位点序列相同的回文序列的序列子集,以及限制性酶的名称及其识别位点的序列。输出序列根据与输入序列相比为生成该序列而进行的nt改变的数量进行排序。 具有最少数量的核苷酸变化的输出序列显示在列表的顶部,并且随后以核苷酸变化数量的递增顺序朝向列表的底部。为了在具有所需突变的突变DNA引物中设计筛选突变,用户可以选择最好地满足所有三个标准的输出序列:(1)与输入序列相比最少的核苷酸变化(2)远离引物末端的筛选突变,和(3)产生可与输入序列区分2. 软件描述REMP 是 用 Python 3.7 开 发 的 , 还 有 itertools 和 tkinter(https://docs.python.org/3/library/)包。REMP可以在生物学家最常用的Windows和Mac操作系统中运行,只需单击相应的应用程序文件(使用Pyinstaller库生成),而无需Python 3编译器。REMP的Python脚本(REMP.py)也可以通过Python 3使用命令提示符/终端在其他操作系统上运行(有关详细信息,请参阅REMP链接中的启动部分REMP的功能描述如下:1. 用户提交在其中间具有所需突变的突变DNA引物序列。所提交的序列在引物的5′端有一个完整的氨基酸密码子。2. 在提交输入核苷酸序列时,REMP将5′端(用户左手侧)的第一个核苷酸视为密码子的第一个位置,并将输入序列以产生由DNA编码的氨基酸序列。输入序列3′端(用户右侧)的不完整密码子,其长度为不是三的倍数,不考虑REMP进行分析。3. 为了创建输入的简并序列,REMP将四个连续密码子视为一个窗口。在重叠窗口中,第一个窗口包含最初的四个密码子(1至4),第二个窗口包含接下来的四个密码子(2至5),第三个窗口包含密码子3至6,依此类推。由于8bp长度的限制性位点可以跨越的最大密码子数目是四个,因此获得的简并序列将足以分析长度为6和8bp的限制性位点Madhavi Latha Yadav Bangaru,Ravi Kumar Medabalimi,Sobhan Babu et al.沪公网安备31011502000118号3+4. REMP一次考虑每个窗口,并生成具有窗口内的四个密码子的所有简并密码子(表1)的简并序列,同时保持输入序列的其余部分不变。这使得对于长度为21 nt的引物,分析可以用最多5184个简并序列而不是279936个序列来完成。5. 在使用滑动窗口技术[11]通过REMP生成的简并序列以及输入序列中,REMP鉴定了与表2中所包括的限制性位点在核苷酸序列上相同的回文六聚体或八聚体序列,并在输出中显示这些简并序列。6. 对于每个输出序列,限制性内切酶的名称以及识别位点的核苷酸序列如果在输入中没有发现限制性位点,并且其简并序列由REMP生成,则在输出中显示单词7. 输出中的序列以与输入序列相比改变的碱基数量3. 说明性示例以下示例说明了REMP的功能(图①的人。长度为26 nt并携带所需突变的DNA引物的输入核苷酸序列“TCAGACCCATTAAAAAGCGCCGACGT”提供在具有标题“突变体引物”的输入窗口中。输入窗口下方的“提交”按钮启动REMP分析。作为第一步,REMP将输入序列转换为 1 ORF使用第一个nt T 在5′端作为密码子TCA的第一个位置,表1[10]从密码子“TCA GAC CCA TTA AAA AGC GCCGAC”生成氨基酸序列为“SDPLKSAD”。因此,必须输入由输入DNA序列的5′端编码的氨基酸的完整密码子。作为对用户的提醒,这也在输入窗口上方被提到为在上述输入序列的3 ′端的nt是三的倍数按照第2节中描述的步骤,通过沉默突变生成的具有限制性位点的输出序列显示在具有标题“具有限制性位点的突变体引物”的输出窗口中。在当前示例中,通过REMP对输入序列产生八种限制性内切酶的识别位点,即Afl II、Afe I、BamHI、DraI、BamHI、Pst I、Pvu II和SacII。输出序列的显示顺序基于输出序列相对于输入序列改变的数字基数来排序。具有限制性位点的输出序列:DraI有一个碱基变化接近在5′端,AfeI在3′端有一个碱基改变,BamH I在3 ′端有一个碱基改变,AflII在靠近5′端有2个碱基改变,AflII向中间有3个碱基改变,AflI在靠近 3′端有3个碱基改变,SacII在靠近3 ′端有3个碱基改变,PvuII和PstI在靠近3′端有4个碱基改变。在该实施例中,在输入序列或由REMP产生的简并序列中不存在8bp长的限制性位点。点击“提示”打开一个单独的窗口,一个PDF文件,说明了输入携带所需突变的DNA序列的最佳实践,并描述了特征一个理想的DNA引物,以指导用户选择最佳的输出序列进行SDM。“清除”按钮可清除输入序列,并允许用户输入新序列进行分析。Fig. 1. REMP的截图。上半部分显示REMP标题、输入序列和命令按钮的空间。下半部分显示了具有由REMP生成的简并序列的输出序列,并分析了限制性位点的存在。限制性内切酶的名称及其识别的回文序列显示在输出序列的右侧。 输出序列根据相对于输入序列改变的碱基的增加数量来排列。设计突变DNA引物是一个多步骤的过程,每一步都需要决策。第一步涉及选择具有所需突变的DNA序列用作引物。REMP进行第二步,通过沉默突变在突变引物中引入在下一步骤中,可以基于使用NEBCutter软件的分析,从由REMP产生的限制性位点中选择产生区分具有所需突变的DNA的消化模式的限制性位点[13]。在最后一步中,可以通过在OligoCalc软件[14]中分析序列来调整具有所选限制性位点的REMP的输出序列的长度,以获得增加与模板DNA结合的特异性的解链温度(Tm)。通过结合使用REMP、NEBCutter和OligoCalc软件,可以更快、更有效地设计SDM的理想突变体引物[15]。4. 影响SDM是目前蛋白质结构-功能分析中最有效的方法之一.SDM总是使用突变引物来产生突变DNA片段。REMP软件通过即时显示输入序列的简并序列来帮助生物学家,所述简并序列具有6- 8bp长度的限制性位点。根据需要,用户可以编辑下载的表1以适应目标生物体的密码子使用。类似地,下载的表2可以通过删除不考虑的限制性位点或以相同的文本格式添加新的位点来编辑与早期用于生成沉默突变的软件相比,REMP提供了长度仅为6-8 bp的限制性位点的输出序列,并避免了显示不需要的框外序列。由于在突变体引物设计期间优选最少的碱基变化,因此REMP根据与输入序列相比变化的碱基数排列输出序列。5. 结论REMP是产生沉默突变的工具,在突变DNA引物中产生长度为6-8bp的限制性位点。REMP很简单在不同的操作系统上作为独立程序安装和运行。REMP是专门开发的,以帮助即使是生物学家在设计理想的突变体没有事先的实践知识Madhavi Latha Yadav Bangaru,Ravi Kumar Medabalimi,Sobhan Babu et al.沪公网安备31011502000118号4表1氨基酸的简并密码子[10]被REMP考虑用于从输入DNA序列生成简并序列。密码子氨基酸密码子氨基酸GCT、GCC、GCA、GCG丙氨酸(A)TTA、TTG、CTT、CTC、CTA、CTG亮氨酸(L)CGT、CGC、CGA、CGG、AGA、AGG精氨酸(R)AAA、AAG赖氨酸(K)AAT、AAC天冬酰胺(N)TTT、TTC苯丙氨酸(F)GAT、GAC天冬氨酸(D)CCT、CCC、CCA、CCGPro(P)TGT、TGC半胱氨酸(C)TCT、TCC、TCA、TCG、AGT、AGC丝氨酸(S)CAA、CAG谷氨酰胺(Q)ACT、ACC、ACA、ACGThr(T)GAA、GAG谷氨酸(E)TGG色氨酸(W)GGT、GGC、GGA、GGG甘氨酸(G)TAT、TAC酪氨酸(Y)CAT、CACHis(H)GTT、GTC、GTA、GTGVal(V)ATT、ATC、ATAIle(I)TAA、TGA、TAG停止ATGMet(M)表2REMP软件中包含的市售限制性内切酶[12限制性位点酶限制性位点酶限制性位点酶公司简介AatIITTTAAADraiGGCGCCPluTIGGTACCACC65iCGGCCGEagICACGTGPmIIAACGTTAclIGAGCTCEco53kITTATAAPsiI-v2AGCGCT阿非GAATTCEcoRIGGGCCCPspOMICTTAAGAflIIGATATCEcoRVCTGCAGPstIACCGTAgeITGCGCAFspICGATCGPvuIGGGCCCApaIAAGCTTHindIII公司简介PvuIIGTGCACApaLIGTTAACHPAIGAGCTCSaciATTAATAseIGGCGCC卡斯公司简介SacIICCTAGGAvrIIGGTACCKpnIGTCGACSaliGGATCCBamHICAATTGMfeIAGTACTSCAITGATCABCLIACGCGTMluIGGCGCCSfoIAGATCTBglIITGGCCAMSCICCCGGGSMAIGCTAGCBmtIGCCGGCNaeITACGTASnaBICGTACGBsiWIGGCGCC南瑞表演SPEI公司简介BspEICCATGGNcoIGCATGCSphITCATGABspHICATATGNdeIAATATTSSPITGTACABsrGIGCCGGCNgoMIVAGGCCTStuIGCGCGCBssHIIGCTAGCNheITCTAGAXbaITTCGAABstBITCGCGANruICTCGAGXhoIGTATACBstZ17IATGCATNsiICCCGGGXmaIATCGATClaIACATGTPciI公司简介ZraIGCGGCCGCNotICCTGCAGGSbfIGGCCGGCCFseIGCGATCGCAsiSIATTTAAATSwaiGTTTAAACPmeITTAATTAAPaciGGCGCGCCASCIGCCCGGGCSRFI初级读本,并附有“说明”文件中易于遵循的指导。作为一个用户友好的软件,REMP允许用户编辑程序要考虑的限制位点列表REMP简化了在突变DNA引物设计过程中引入新限制性位点的困难步骤竞合利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作致谢NKR感谢Sundaresan对软件开发的鼓励。资金这项工作部分得到了印度新德里科学和工业研究委员会[No. 13(8893- A)/2017-Pool]给MLYB和印度生物技术部[授权号BT/PR35825/BRB/10/1840/2019]给NKR的资金支持。引用[1]Hutchison CA, Philips M , Edgell MH, Gillam S, Jahnke P ,Smith M.DNA序列中特定位置的突变。J Biol Chem1978;253:6551-60.[2]Stemmer WP,Morris SK.酶促反向PCR:一种高效、定点诱变的限制性位点独立、单框方法。生物技术1992;13:214-20.[3]Papworth C , Bauer JC , Braman J , Wright DA. Quikchange 定 点 诱 变 .Strategies1996;9:3-4.[4]Gibson DG,Young L,Chuang RY,Venter JC,3rd HutchisonCA,SmithHO. DNA 分 子 的 酶 促 组 装 多 达 数 百 个 酶 。 自 然 方 法 2009;6 : 343-5.http://dx.doi.org/10.1038/nmeth.1318网站。[5]Shankarappa B,Vijayananda K,Ehrlich GD. SILMUT:用于鉴定适合于沉默诱变以引入限制性酶识别序列的区域的计算机程序。生物技术1992;12:882[6]Turchin A,Lawler JF.引物发生器:一个程序,有助于选择寡核苷酸进行定点诱变。生物技术1999;26:672-6.[7]作者:Evans PM,SiteFind:用于引入限制性位点作为成功定点诱变的标记的软件工具。BMC Mol Biol2005;6:22.[8]Karnik A,Karnik R,Grefen C. SDM-辅助软件设计引入沉默限制性位点的定点诱变引物。BMCBioinformatics2013;14:105.http://dx.doi.org/10.1186/1471-2105-14-105网站。[9]Raghavendra NK,Rao DN.核酸外切酶和核酸内切酶之间的功能合作-限制性内切酶进化的基础。核酸研究2003;31:1888-96。[10]Khorana HG.多核苷酸合成和遗传密码。Fed Proc1965;24:1473-87.Madhavi Latha Yadav Bangaru,Ravi Kumar Medabalimi,Sobhan Babu et al.沪公网安备31011502000118号5[11]Datar M,Gionis A,Indyk P,Motwani R.在滑动窗口上维护流统计。SIAMJ Comput 2002;31:1794[12]Roberts RJ,Mr. T,Posfai J,Macelis D. DNA限制和修饰数据库:酶,基因和基因组。NucleicAcidsRes2015;43:D298-9.http://dx.doi.org/10.1093/nar/gku1046网站。[13][103] J. J. NEBcutter:用限制性内切酶切割DNA的程序。核酸研究2003;31:3688-91。[14] Kibbe WA. OligoCalc : 一 个 在 线 的 寡 核 苷 酸 特 性 计 算 器 。 核 酸 研 究2007;35:W 43 -6。http://dx.doi.org/10.1093/nar/gkm234网站。[15]George A,N.K.拉格哈文德拉LEDGF/p75的IBD的L368 F/V408 F双突变体保留 与 HIV-1 整 合 酶 的 M178 I 突 变 体 的 相 互 作 用 。 Biochem Biophys ResCommun2017;490:271-5.
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功