没有合适的资源?快使用搜索试试~ 我知道了~
LEPStr:麻风分枝杆菌短串联重复序列数据库
医学信息学解锁19(2020)100322LEPStr:麻风分枝杆菌短串联重复序列数据库Partha Sarathi Mohantya,*,Dimple Saikiaa,Siddhant Kalra b,Farah Naaz a,Avi KumarBansal a,Harpreet Singh Pawarc,Keshar Kunja Mohanty d,Sandeep Sharma a,Manjula Singh e,施里帕德A帕蒂尔fa印度阿格拉Tajganj国家JALMA麻风病和其他分枝杆菌疾病研究所流行病学系印度索兰瓦克纳加特杰比信息技术大学c印度阿格拉Tajganj国家JALMA麻风病和其他分枝杆菌疾病研究所临床部d印度阿格拉Tajganj国家JALMA麻风病和其他分枝杆菌疾病研究所免疫学系印度新德里印度医学研究委员会流行病学和传染病司f印度阿格拉Tajganj JALMA国家麻风病和其他分枝杆菌疾病研究所A R T I C L EI N FO保留字:麻风分枝杆菌短串联重复序列微卫星小卫星A B S T R A C T短串联重复序列是一组短的核苷酸序列,在许多生物学过程中起着重要作用,包括转录调节、基因表达增强、对特定环境的适应以及与常染色体隐性遗传病的联系。短串联重复序列也用于研究DNA指纹,用于保护遗传学,物种的分类特异性鉴定,传染病传播动力学和标记辅助选择。在本研究中,我们开发了一个在线数据库,LEPStr,麻风分枝杆菌短串联重复序列,以及拷贝数变异、发生基因和扩增串联重复序列区域的引物。对M.麻风,MRHRU-235,登录号CP 029543,用作模板,用串联重复序列查找器筛选STR。采用JavaScript(JS)和Java Server Pages(JSP)开发了LEPStr的数据库布局,并在MySQL数据库中实现。开发了一个用户友好的交互式和免费使用的网络界面,用于浏览M.麻风,以及扩增重复区域的引物。LEPStr是一个在线数据库,其中嵌入了所有M的短串联重复序列。麻风病人LEPStr对M.麻风菌株,追踪麻风病的传播动力学。1. 介绍短串联重复序列(STR)是DNA中具有突变倾向的短串联序列,分为微卫星和小卫星。微卫星通常由1bp至6bp的短基序组成,而小卫星具有7bp至几十个碱基对的较长基序长度[1,2]。有证据表明,SSR(简单重复序列)不是DNA的垃圾串,而是在适应性进化中起着积极的作用SSR在适应性进化中的作用是:增强基因表达[3],调节转录[4],转录、翻译和功能调节因子[5],田鼠的社会结构趋异[6],果蝇的温度补偿[7],野生大麦的适应性趋异[8],小麦的适应性生态地理分化[9],北极熊[10]和微卫星GAA三联体重复扩增引起的共济失调常染色体隐性遗传病[11]。SSR的不稳定性在最小的遗传负荷下增加了丰富的数量遗传变异;另一方面,重复单元的纯度和基序的长度决定了突变率和效应[1]。从历史上看,SSR可用于研究用于遗传学的DNA指纹[12]、物种的分类特异性鉴定[13]、传染病传播动力学[14]和标记辅助选择[15]。麻风病是一种由麻风分枝杆菌(一种不可培养的细菌)引起的慢性传染病。分枝杆菌基因组Cole等人对麻风进行了全基因测序[16]。全基因组序列M.麻风提供了对细菌的几个不寻常特征的深入了解。 在2010年期间,* 通讯作者。电 子 邮 件 地 址 : m. gmail.com ( 附 : Mohanty ) , gmail.com ( D.Saikia ) , sidkalra512@gmail.com ( S.Kalra ) , farahferry@gmail. com ( F. Naaz ) ,bansalavikumai@gmail.com ( A.K.Bansal ) , drharpreet728@gmail.com ( H.S.Pawar ) , keshar63@yahoo.com ( K.K.Mohanty ) , yahoo.in ( S.Sharma ) ,drmanjulasb@gmail.com(M. Singh),shripadpatil@yahoo.com(S.A. 帕蒂尔)。https://doi.org/10.1016/j.imu.2020.100322接收日期:2019年12月15日;接收日期:2020年3月7日;接受日期:2020年3月24日可于2020年2352-9148/©2020的 自行发表通过Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)中找到。可在ScienceDirect上获得目录列表医学信息学期刊主页:http://www.elsevier.com/locate/imuP.S. Mohanty等人医学信息学解锁19(2020)1003222Fig. 1. LEPStr主页的屏幕截图。在网页界面的顶部,用户可以浏览微卫星和小卫星选项卡。在M.麻风病人基因组的缩小和嵌合排列是由分散的重复序列之间的广泛重组事件引起的[16]。几位作者使用串联重复模式和拷贝数的变化来表征,对M.麻风[17-21 ]。考虑到SSR的几种适应性进化作用,我们假设大量的SSRSSR在M.在宿主适应期的麻风病。在本研究中,我们准备了一个广泛的列表中的SSR存在于基因组中的M。麻风菌的菌株,并将其排列在一个名为LEPStr的数据库中,这将有助于M. 麻风病人2. 材料和方法2.1. 序列检索和STR检索对M. 麻风,MRHRU-235,登录号CP 029543,用作筛选STR的模板 。 MRHRU-235 的 全 基 因 组 从 GenBank ( https : //www.ncbi.nlm.nih.gov/nuccore/NZ_CP029543.1)。使用串联重复序列查找器(TRF)软件版本4.09扫描全基因组[22]。在M. 麻风病人其中90颗是微型卫星,76颗是小型卫星。2.2. STR发生基因的鉴定及引物设计对分类群M进行了爆炸搜索。用NCBI核苷酸BLAST搜索引擎搜索麻风病人与100%概率匹配的STR连同其拷贝数一起被包括在数据集中。STR发生的基因也来自匹配的基因集。这些基因的名称取自M。麻风参考基因组登录号AL 583917。使用引物BLAST在NCBI设计STR区域的引物。还记录了每个引物的GC%和解链温度(Tm)。为确定各STR位点的分布及拷贝数变异,对M。提交给NCBI的来自不同地理区域的麻风,本研究还包括印度(登记号AL 583917,CP 09543)、日本(登记号AP014567)和巴西(登记号FM 211192)。2.3. 数据库设计与实现LEPStr数据库的布局使用JavaScript(JS)和Java Server Pages(JSP)开发在脚本和布局开发之后,数据库的所有数据都位于本地MySQL数据库中。LEPStr数据库托管在国家JALMA麻风病和其他分枝杆菌疾病研究所的网站上,研究所数据库的布局是在这样,它允许我们轻松地扩展和添加新数据。3. 结果3.1. LEPStr中工具的描述LEPStr数据库的主页包含两个选项卡,即,M. 麻风病和团队。用户可以使用M. 麻风标签此外,LEPStr被分为两个数据集,图二、微卫星主页显示二、三、四、 五和六核苷酸重复的屏幕截图。图三. 显示重复单元和拷贝数的微卫星截图。P.S. Mohanty等人医学信息学解锁19(2020)1003223见图4。二核苷酸重复单元的屏幕截图以及重复单元的坐标,即,出现的基因、拷贝数、以FASTA格式下载STR区域的选项、扩增目的序列的引物以及扩增产物大小、引物的GC%和Tm图五、数据库“LEPStr”的操作流程图, 显 示每 个 选 项卡 的 导 航模 式 。微型卫星和微型卫星(图1)。微卫星标签包含具有2bp重复至6bp重复的卫星区域,并被称为二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸重复(图2)。用户可通过点击提供的链接导航至可疑交易报告的详细信息。此外,微卫星还提供了关于共有序列、重复单位、登录号(GenBank)、重复单位拷贝数、该数据库中所用菌株的地理来源以及每个STR区域中核苷酸变异的信息(图3)。LEPStr中描述了总共90个微卫星。细节包括重复单元的坐标,即,出现的基因,拷贝数,下载FASTA中STR区域的选项格式、扩增目的序列的引物以及扩增产物大小、GC%和引物的Tm(图1)。 4)。小卫星标签含有11bp-24 bp、27 bp、29 bp、30 bp和52 bp重复序列的卫星区域,称为11bp重复序列、12 bp重复序列等。在LEPStr中描述了总共76颗小卫星此外,小型卫星的布局与微型卫星的布局相同。用户可通过数据库顶部提供的选项卡直接在小型卫星和微型卫星之间导航。操作数据库的总体工作流程见图。 五、P.S. Mohanty等人医学信息学解锁19(2020)10032243.2. 讨论和结束语M.麻风病是一种不可培养和生长缓慢的细菌。该菌的培养期为2 ~ 20年。麻风病的确切传播方式尚不清楚,但认为它是通过长期接触的气溶胶途径传播的[23]。多株M.一个家庭中的麻风病人显示出多种疾病来源[21]。一些作者提供了对M.水和土壤中的麻风[21,24]。由于STR对菌株分型很有用,因此LEPStr数据库将有助于分型 分枝麻风菌株,追踪麻风在人与人之间和环境与人之间的传播动力学。服务器地址:https://www.jalma-icmr.org.in/LEPStr/资金这项工作得到了印度医学研究委员会的支持。伦理声明NA.竞合利益我们确认作者没有利益冲突确认我们非常感谢新德里印度医学研究委员会为本研究提供的财务和后勤支持。附录A. 补充数据本文的补充数据可在https://doi网站上找到。org/10.1016/j.imu.2020.100322。引用[1] Kashi Y,King DG.简单重复序列在进化中是有利的突变体。Trends Genet2006;22:253-9. https://doi.org/10.1016/j.tig.2006.03.005网站。[2] Avvaru AK,Sharma D,Verma A,Mishra RK,Sowpati DT. MSDB:附加说明的微型卫星综合数据库。核酸研究2019。https://doi.org/10.1093/nar/gkz886.gkz886。[3] Hamada HI,Seidman MI,Howard BH,Gorman CM.通过聚(dT-dG)增强基因表达。poly(dC-dA)序列。分子细胞生物学1984;4:2622-30. 网址:http://doi.org/10.1128/mcb.4.12.2622[4] [10]孙文良,王文良.均聚谷氨酰胺和脯氨酸片段调控的转录激活。 Science 1994;263:808-11.https://doi.org/10.1126/science.8303297网站。[5] 张文龙,王文龙,王文龙.VNTR(可变数目串联重复)序列作为转录、翻译或功能调节因子。JHum Genet1998;43:149-52.https://doi.org/10.1007/s100380050059网站。[6] Hammock EA,Young LJ.功能性微卫星多态性与田鼠不同的社会结构相关。MolBiol Evol 2004;21:1057-63. 网址:http://doi.org/10.1093/molbev/msh104[7] Sawyer LA,Hennessy JM,PeiX oto AA,Rosato E,Parkinson H,Costa R,Kyriacou CP.果蝇生物钟基因的自然变异和温度补偿。Science 1997;278:2117-20.https://doi.org/10.1126/science.278.5346.2117啊[8] [10]张文辉,张文辉.以色列“进化论”中小气候胁迫下野生大麦基因组微卫星适应性分化。Biol J Linn Soc 2005;84:205-24. https://doi.org/10.1111/j.1095-8312.2005.00425。X.[9] FahimaT,Ro€derMS,WendehakeK,KirzhnerVM,NevoE. 中国野生二粒小麦自然群体微卫星多态性分析以色列Theor Appl Genet 2002;104:17-29. https://doi.org/10.1007/s001220200002。[10] Lunn NJ,Paetkau D,Calvert W,Atkinson S,Taylor M,Strobeck C.幼仔收养北极熊(Ursus maritimus):用微卫星标记确定亲缘关系JZool 2000;251:23-30. https://doi.org/10.1111/j.1469-7998.2000.tb00589。X.[11] CampuzanoV,MonterminiL,Molto�MD,PianeseL,Cos�eeM,CavalcantiF,Monros E,Rodius F,Duclos F,Monticelli A,Zara F.弗里德赖希共济失调:由内含子GAA三联体重复扩增引起的常染色体隐性遗传病。 Science 1996;271:1423-7.https://doi.org/10.1126/science.271.5254.1423网站。[12] Abdul-Muneer PM.微卫星标记在保护遗传学和渔业管理中的应用:种群结构分析和保护策略的最新进展。Genet Res Int 2014:e691759。https://doi.org/10.1155/2014/691759。[13] Srivastava S,Avvaru AK,Sowpati DT,Mishra RK.真核生物基因组中微卫星的分布模式。BMC Genom 2019;20:e153. 网址://doi. org/10.1186/s12864-019-5516-5。[14] Mohanty PS,Bansal AK,Naaz F,Arora M,Gupta UD,Gupta P,Sharma S,Singh H. 麻风分枝杆菌在一个有4名患者的家庭中的多菌株感染:一项采用短串联重复序列的研究PloS One 2019;14:e0214051. 网址://doi.org/10.1371/journal.pone.0214051。[15] Collard BC,Mackill DJ。标记辅助选择:21世纪植物精密育种的一种方法。PhilosTrans R Soc Lond B Biol Sci 2008;363:557-72. https://doi.org/10.1098/rstb.2007.2170。[16] Cole ST,Eiglmeier K,ParkhillJ, James KD,Thomson NR,Wheeler PR,Honore N,Garnier T,Churcher C,Harris D,Mungall K,Basham D,Brown D,Chillingworth T,Connor R,Davies RM,Devlin K,Duthoy S,Feltwell T,Fraser A,Hamlin N,Holroyd S,Hornsby T,Jagels K,LacroiXC,MacleanJ, Moule S,Murphy L,Oliver K,Quail MA,Rajandream MA,Rutherford KM,Rutter S,Seeger K,Simon S,Simmonds M,RuttonJ,Squares R,Squares S,Stevens K,Taylor K,Whitehead S,Woodward Jr,Barrell BG.麻风杆菌中的大量基因衰变。Nature 2001;409:1007-11. https://doi.org/10.1038/35059006网站。[17] Jensen RW,RivestJ, Li W,Vissa V.使用可变数目串联重复序列(VNTR)-片段长度分析(FLA)进行麻风分枝杆菌菌株的DNA指纹分析。JoVE 2011;15:e3104. https://doi.org/10.3791/3104网站。[18] Kimura M,Sakamuri RM,Groathouse NA,Rivoire BL,Gingrich D,Krueger- Koplin S,Cho SN,Brennan PJ,Vissa V.麻风分枝杆菌临床标本的临床微生物学杂志2009;47:1757-66. https://doi.org/10.1128/JCM.02019-08网站。[19] Young SK,Ponnighaus JM,Jain S,Lucas S,Suneetha S,Lockwood DN,YoungDB,Fine PE.使用短串联重复序列研究马拉维和印度麻风病人中的麻风分枝杆菌PLoS被忽视的Trop Dis 2008;2:e214.https://doi.org/10.1371/journal.pntd.0000214网站。[20] Shinde V,Newton H,Sakamuri RM,Reddy V,Jain S,Joseph A,Gillis T,Nath I,Norman G,Vissa V.南印度麻风患者中麻风分枝杆菌的VNTR分型。LeprRev2009;80:290-301.[21] Mohanty PS,Naaz F,Katara D,Misba L,Kumar D,Dwivedi DK,TiwariAK,Chauhan DS,Bansal AK,Tripathy SP,Katoch K.麻风分枝杆菌在环境中的生存力及其在麻风传播中的作用印度性病皮肤病学杂志麻风2016;82:23-7. https://doi.org/10.4103/0378-6323.168935网站。[22] 本森湾Tandem Repeats Finder:一个分析DNA序列的程序。核酸研究1999;27:573-80。https://doi.org/10.1093/nar/27.2.573网站。[23] Noorsksk. Epidemiology of leprosy. In:Gangadharam PRJ,Jenkins PA,editors.分 枝 杆菌 。 Chapman Hall医 学 微生 物 学 系列 &Boston, MA: Springer; 1988.https://doi.org/10.1007/978-1-4615-7511-5_14网站。[24] 布莱克洛杉矶,西不列颠哥伦比亚省,拉里CH,托德JRIV。麻风病的环境非人类来源。RevInfectDis1987;9:562-77.https://doi.org/10.1093/clinids/9.3.562网站。
下载后可阅读完整内容,剩余1页未读,立即下载
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![whl](https://img-home.csdnimg.cn/images/20210720083646.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![7z](https://img-home.csdnimg.cn/images/20210720083312.png)
![7z](https://img-home.csdnimg.cn/images/20210720083312.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![7z](https://img-home.csdnimg.cn/images/20210720083312.png)
![7z](https://img-home.csdnimg.cn/images/20210720083312.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![](https://profile-avatar.csdnimg.cn/default.jpg!1)
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- 利用迪杰斯特拉算法的全国交通咨询系统设计与实现
- 全国交通咨询系统C++实现源码解析
- DFT与FFT应用:信号频谱分析实验
- MATLAB图论算法实现:最小费用最大流
- MATLAB常用命令完全指南
- 共创智慧灯杆数据运营公司——抢占5G市场
- 中山农情统计分析系统项目实施与管理策略
- XX省中小学智慧校园建设实施方案
- 中山农情统计分析系统项目实施方案
- MATLAB函数详解:从Text到Size的实用指南
- 考虑速度与加速度限制的工业机器人轨迹规划与实时补偿算法
- Matlab进行统计回归分析:从单因素到双因素方差分析
- 智慧灯杆数据运营公司策划书:抢占5G市场,打造智慧城市新载体
- Photoshop基础与色彩知识:信息时代的PS认证考试全攻略
- Photoshop技能测试:核心概念与操作
- Photoshop试题与答案详解
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)