没有合适的资源?快使用搜索试试~ 我知道了~
医学信息学解锁25(2021)100671MutaCheck:检测线粒体DNA单核苷酸多态性(SNP)和相关疾病Harini Subramaniam,P Dhahani,Devashish Devashish,V Suchithra,Vidya Niranjan*印度班加罗尔R V工程学院生物技术系A R T I C L EI N FO保留字:线粒体DNA单核苷酸多态性分析管道线粒体疾病突变A B S T R A C T该项目利用各种在线工具和数据库以及独特的代码来深入了解与线粒体DNA相关的人类疾病。从NCBI获得测序读数形式的原始信息,最后,将来自这些在线工具的数据与Python代码拼接,以提供突变比较以及从ClinVar获得的预先存在的已知致病突变数据库。我们获得的输出提供了单核苷酸多态性的规格以及它们在可能条件下的临床意义,并预测可能存在的线粒体DNA。因此,创建了用于分析线粒体DNA基因组的管道,以检测致病性突变的存在并预测这些突变的临床意义1. 介绍1.1. 线粒体DNA在人类中,有两种包含独立遗传物质的重要细胞器:细胞核和线粒体。 真核细胞中的线粒体DNA在将化学能从碳水化合物转化为三磷酸腺苷(ATP)的过程中起着重要作用。线粒体DNA是环状双链DNA,由约16,569个核苷酸组成,由37个基因组成,编码13种参与氧化磷酸化的酶[1]。线粒体DNA中的有害突变会导致疾病,特别是在依赖有氧代谢的组织和器官中[2]。核DNA和线粒体DNA之间本质上的某些差异赋予后者某些独特的性质,迫使研究人员使用不同的技术来分析线粒体DNA(mtDNA)。与核DNA(nDNA)不同,mtDNA是严格的母系遗传,因此它有助于通过谱系确定疾病的遗传,并且可以通过系谱和家族史进行分析[3]。每个细胞由细胞核中的2组23条染色体的单个拷贝组成,然而,细胞由许多线粒体组成,每个线粒体包含数十个mtDNA,因此细胞可以包含数千个线粒体基因组拷贝[4]。线粒体的遗传密码也各不相同从核DNA的通用遗传密码,而内含子,经常出现在核DNA的基因被注意到是不存在的mtDNA。线粒体DNA比基因组DNA具有更快的突变速率线粒体DNA中的某些突变引起线粒体呼吸链的破坏,并且是一组异质性临床病症的原因。1.2. 线粒体DNA的修复机制核DNA编码控制线粒体DNA复制和修复的聚合酶(PolG)基因。一些突变是由于PolG的自发复制错误而发生的。研究表明,mtDNA中普遍存在缺失和点突变的积累,有时与衰老或氧化应激等有关。在线粒体中,碱基切除修复等修复系统稍有效率,但错配修复系统效率低下,其他常见的修复机制如核苷酸和核糖核苷酸切除修复机制在mtDNA中缺失。线粒体DNA的突变导致许多线粒体疾病[5]。1.3. mtDNA突变线粒体DNA的息肉样本质-存在数千个* 通讯作者。电子邮件地址:rvce.edu.in(H.Subramaniam),rvce.edu.in(P. Dhabani),rvce.edu.in(D.Devashish),suchithrav@rvce.edu.in(V. Suchithra),vidya. n@rvce.edu.in(V. Niranjan)。https://doi.org/10.1016/j.imu.2021.100671接收日期:2021年5月26日;接收日期:2021年7月14日;接受日期:2021年7月14日2021年7月15日在线提供2352-9148/©2021的 自行发表通过Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)中找到。可在ScienceDirect上获得目录列表医学信息学期刊主页:www.elsevier.com/locate/imuH. Subramaniam等人医学信息学解锁25(2021)10067125. 缩写ATP三磷酸腺苷mtDNA线粒体DNA PolG聚合酶γSNP单核苷酸多态性OMIM在线孟德尔遗传rCRS修订的剑桥参考序列线粒体DNA在单个细胞中-赋予线粒体DNA一种特殊的特性。当线粒体DNA的所有拷贝的基因型是相同的,它被称为同质性。类似地,异质性代表两种或更多种线粒体基因型的混合。这些参数根据其值和阈值确定各种线粒体疾病的表型。同质突变是那些影响所有mtDNA拷贝的突变,异质突变存在于一些线粒体中。仅限复印件。在异质突变中,存在导致线粒体疾病临床表型表达的突变数量的阈值[6]。1.4. 线粒体DNA突变引起的疾病线粒体疾病引起的病症可能影响某些特定器官或可能涉及多个器官系统,主要涉及肌病和神经源性特征。线粒体疾病可以在出生后立即检测到,然而,通常症状可能在10-20岁之间发展 某些症状集群被分组在一起,定义了一个在某些情况下,个体表现出临床变异性,并且不能区分为特定类别的疾病。 因此,疾病谱表现出表型重叠,线粒体疾病的类型。 常见的临床病症包括眼睑下垂、视力问题、运动不耐受、听力问题、耳聋、心肌病、糖尿病和感染风险增加。常见的神经系统症状是类似自闭症的特征,如学习残疾, 发育迟缓,肌肉无力,Fig. 1. 整个方法概述:使用Python代码制备人类序列(右)并将其与数据库(左为红色方框)进行比较以获得结果。(For关于这一图中颜色的解释,请读者参阅本文的网络版H. Subramaniam等人医学信息学解锁25(2021)1006713图二、 来自mt-SNPs数据库的前25个条目。肌肉协调、生长不良、智力迟钝、运动障碍、痴呆、癫痫、偏头痛、共济失调、中风和痉挛状态[2]。许多疾病与其他疾病如阿尔茨海默氏症和帕金森氏症以及糖尿病等疾病有关1.5. 常见的线粒体疾病有➢ 耳聋➢ 非综合征型耳聋➢ 细胞色素氧化酶缺乏症➢ Leber遗传性视神经病变➢ 母系遗传性糖尿病和耳聋(MIDD)➢ Kearns-Sayre综合征➢ 线粒体脑肌病、乳酸酸中毒和卒中样发作(MELAS)➢ 肌阵挛癫痫伴破碎红纤维(MERRF)➢ Leigh综合征➢ 线粒体复合物III缺乏➢ 皮尔逊骨髓胰腺综合征➢ 进行性眼外肌麻痹➢ 神经病、共济失调和色素性视网膜炎(NARP)2. 方法2.1. 数据库管理在线人类孟德尔遗传(OMIM)是一个在线知识库图三. Mitomaster工具主页[12]。H. Subramaniam等人医学信息学解锁25(2021)1006714图四、 智人分离物R11 DNA,完整基因组片段-来自 NCBI的 FASTA序列将该序列输入Mitomaster,并以CSV格式下载突变的详细描述图五. Mitomaster中的序列比对和所有突变的检测。H. Subramaniam等人医学信息学解锁25(2021)1006715见图6。从Mitomaster下载的序列中的突变此文件用于运行代码。基因,基因组,遗传表型,以及它们之间的关系。它是不断更新的基因,遗传疾病及其表型和性状。所有条目包括临床概要的比较,以及基因组资源和各种参考文献的[8]的一项建议。OMIM在本研究中用于获得关于mtDNA中特定突变与相关疾病的关系以及通过研究论文分析的各种病例研究中表达的特定临床状况的信息。见图7。管道中使用的序列的代码输出。结果列出了三种突变及其涉及的基因、蛋白质、条件和临床意义整个管道已上传到GitHub:https://github.com/VSuchi/MutaCheck以供参考。H. Subramaniam等人医学信息学解锁25(2021)1006716位于马里兰州贝塞斯达的美国国立卫生研究院(NIH)拥有一个在线、公开的人类遗传变异及其作为疾病表型的意义的集中储存库,称为ClinVar。它包括变异的描述;与变异相关的条件;变异在症状和疾病方面的临床意义。它还包含检查继承模式的选项。ClinVar数据集可在网站(https://www.ncbi.nlm.nih.gov/clinvar/)上访问,并可在ftp网站(ftp.ncbi.nlm.nih.gov/pub/clinvar/)上下载[9]。修订的剑桥参考序列(rCRS)是人类基因组计划中注释mtDNA的参考序列。 使用rCRS,我们得到了构成mtDNA的37个基因的列表,这个序列也被用于比较以识别突变的工具。在该项目中,使用rCRS,将每个基因名称输入ClinVar搜索,以获得关于所有已知突变的数据库,这些突变导致可能在基因内表达的疾病。将每个基因的列表连接起来,以获得mtDNA中所有可能的致病性和可能的致病性突变的列表。由于我们的项目仅关注单核苷酸多态性,因此从数据库中删除了除转换以外的所有突变,即缺失和插入。最终列表包括所有可能的致病性mt-SNP以及关于发生突变的相应基因的信息、相关的翻译蛋白、临床状况和意义以及其他鉴定标记物,如变异ID、等位基因ID、登录号、规范SPDI等。 该数据库被命名为mt-SNPs数据库(图11)。 2)的情况。列由标准突变命名[10]、发生突变的基因、翻译后可能受影响的蛋白质、与突变相关的条件、临床意义、登录号、基因组、基因组中的位置和四个指定的ID。2.2. 分析用序列的制备序列可以以原始读数(sra数据)的形式或以组装的序列形式获得。由于线粒体DNA与基因组DNA不同,用于组装、注释和分析突变的工具也不同于用于基因组DNA的常规工具。如果以原始读数的形式获得数据,则存在将读数组装成序列的各种在线以及独立工具。在我们的研究过程中,我们遇到了一个在线工具mtDNAprofiler,它包括四个工具:mtDNA命名,mtDNA组装,mt-SNP转换和mt-SNP一致性检查。该工具接受FASTA格式的输入,并提供各种功能来组装线粒体DNA序列以及用于分析片段的命名法,并对输出进行质量控制[11]。在我们的项目中,我们以FASTA格式从NCBI获得了预组装的mtDNA全基因组序列(图1)。 4). 对于这些序列的直接分析,我们使用Mitomaster。Mitomaster接受FASTA格式的序列,并识别核苷酸变体、单倍型组、识别新的DNA序列变体、评价每个变体的潜在生物学意义等。MITOMASTER(图3)可在http://mammag.web.uci.edu/twiki/bin/view/Mitomaster 上 访 问[12]。从Mitomaster获得的结果以csv格式下载用于进一步分析(图1A和1B)。5和6)。2.3. 序列与数据库对于输入序列的最后分析,我们使用Python编程语言编写的唯一代码。该代码使用从Mitomaster获得的CSV格式的结果,并将突变列表与mt-SNPs数据库进行比较。它扫描两个CSV表来找到路径的匹配基因或可能的致病突变。‘Pandas查询序列输出结果显示匹配的突变,并显示与来自mt-SNP数据库的突变相关的致病条件和临床意义以及基因和与突变有关的蛋白质(图 7)。3. 结果和讨论3.1. 为例使用以下示例演示了管道(图1)。 1)、从NCBI获得线粒体序列,以FASTA格式下载4. 未来范围有多种方法可以改进此管道,以便为所提供的结果添加更多价值。首先,可以修改该管道以分析不同的物种。其次,我们的目标是扩展该项目,以包括导致线粒体疾病(人类)的所有突变的分析,包括小的和大的缺失,插入等,整个管道可以进一步自动化,以包括所有多个工具和拼接代码在一个单一的用户友好的平台,不需要任何编码知识。这个工具可以提供更多的关于单倍群遗传和基因注释的信息.该管道可以与高于阈值的突变的定量相结合,以更准确地预测表型。进一步的深入研究将使我们能够得出相关性-在已知的线粒体疾病和阿尔茨海默氏症和帕金森氏症之间其可以预测已经被鉴定为具有某些突变遗传的患者中这类疾病的发展和临床表达。竞合利益作者声明,他们没有已知的可能影响本文所报告工作确认我们要衷心感谢印度班加罗尔R V工程学院生物技术系的工作人员和非工作人员,感谢他们为我们提供了开展该项目的技能我们向R VCollege的EXcelence中心表示感谢,感谢他们最初的指导和动机,以探索各种主题和不断的支持。特别感谢先生。Akshay Uttarkar先生。Vasanth Kumar Desai帮助我们理解基本概念。引用[1] 线粒体DNA -遗传学家庭参考- NIH。(未注明)。https://ghr.nlm.nih的网站。gov/martical-DNA #资源。[2020年9月6日]。[2] Chinnery PF.线粒体疾病概述。在:GeneReviews®.华盛顿大学西雅图分校 线粒体疾病综述; 1993年。[3] 线粒体DNA(n.d.).,来自线粒体DNA播放音频[访问于2020年9月6日]。[4] 线粒体DNA与线粒体疾病|在Scitable学习科学。(n.d.),从https://www.nature.com/scitable/topicpage/mtDNA-and-mitochondrial-diseases-903/[访问于2020年9月6日]。[5] Copeland WC,Longley MJ.健康与疾病中的线粒体基因组维持。DNA修复2014;19:190-8. https://doi.org/10.1016/j的网站。 DNArep.2014.03.010。[6] Taylor RW,Turnbull DM.人类疾病中的线粒体DNA突变。Nat RevGenet 2005;6(第5期):389-402 [人类疾病中的线粒体DNA突变]。[7] 柯尼希儿童线粒体疾病的表现和诊断于:小儿神经病学,第38卷; 2008年。第305- 313页。https://doi.org/10.1016/j的网站。 pediatrneurol.2007.12.001。NIH Public Access.[8] Amberger JS,Bocchini CA,Scott AF,Hamosh A. OMIM。org:leveragingknowledge across phenotype-gene relationships,vol. 47; 2019年。p. 1038 OMIM.org-43 [ www.example.com:利用表型-基因关系的知识]。[9] Landrum MJ,Lee JM,Benson M,Brown GR,Chao C,Chitipiralla S,GuB,Hart J,Hoffman D,Jang W,Karapetyan K,Katz K,Liu C,MaddipatlaZ,Malheiro A,McDaniel K,Ovetsky M,Riley G,Zhou G,Maglott DR.ClinVar:April2010H. Subramaniam等人医学信息学解锁25(2021)1006717不同的解释和支持证据。Nucleic Acids Res 2018;46(D1):D1062-7 [ClinVar:改善对变异解释和支持证据的访问]。[10] [10]杨文辉,张文辉,张文辉.分子诊断学中的标准突变命名法:实践和教育挑战。J MolDiagn 2007;9(1):1-6. https://doi.org/10.2353/jmoldx.2007.060081网站。[11] Yang IS,Lee HY,Yang WI,Shin KJ. MtDNAprofiler:一个用于人类线粒体DNA序列命名和比较的网络应用程序。法医学杂志Sci 2013;58(4):972[12] Brandon MC,Ruiz-Pesini E,Mishmar D,Procaccio V,Lott MT,Nguyen KC,Spolim S,Patil U,Baldi P,Wallace DC. MITOMASTER:用于分析线粒体DNA序列的生物信息学工具。MITOMASTER:用于分析线粒体DNA的生物信息学工具序列]。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 李兴华Java基础教程:从入门到精通
- U盘与硬盘启动安装教程:从菜鸟到专家
- C++面试宝典:动态内存管理与继承解析
- C++ STL源码深度解析:专家级剖析与关键技术
- C/C++调用DOS命令实战指南
- 神经网络补偿的多传感器航迹融合技术
- GIS中的大地坐标系与椭球体解析
- 海思Hi3515 H.264编解码处理器用户手册
- Oracle基础练习题与解答
- 谷歌地球3D建筑筛选新流程详解
- CFO与CIO携手:数据管理与企业增值的战略
- Eclipse IDE基础教程:从入门到精通
- Shell脚本专家宝典:全面学习与资源指南
- Tomcat安装指南:附带JDK配置步骤
- NA3003A电子水准仪数据格式解析与转换研究
- 自动化专业英语词汇精华:必备术语集锦
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功