DNA序列数据库提交指南:选择DDBJ、EMBL和GenBank

版权申诉
0 下载量 84 浏览量 更新于2024-07-03 收藏 87KB DOC 举报
提交DNA序列到数据库 本章节主要介绍了将DNA序列及其注解提交到公共数据库的过程,特别是与国际核苷酸序列协作数据库DDBJ、EMBL和GenBank密切相关的数据库。我们讨论了两种不同的提交方法,一种基于互联网,使用工具如Bankit;另一种使用Sequin,这是一个多平台程序,可以在具有网络连接的情况下使用,但也可以脱机工作。 Sequin是一种利用NCBI数据模型的ASN.1编辑工具,能够对序列数据进行编辑和注解,并且是许多采用NCBI的序列分析工具的平台,因此,Sequin是可供选择的升级工具。使用Sequin,可以快速地将序列数据提交到公共数据库中,并且可以对序列数据进行详细的注解和编辑。 提交DNA序列到公共数据库已经成为一条准则,大多数期刊不再刊登完整的序列数据,而是要求研究者们在公开发表文章时提交序列数据到公共数据库中。基因组测序时期已经影响了科学界,许多科学家公布他们发现的序列先于发表对其进行的详细分析,这个习惯已成为大型基因研究中心的规定。 数据库内容的增长是指数性的,大多数早期的序列记录是由对于某个基因感兴趣的单个的科学家提交的,适合这种情况的提交程序必须允许手工进行生物学信息的任意注解。然而最近这些数据库不得不接受新类型的数据,而且提交速度要有实质性的提高。在EST测序开始不久,为了接受这些记录必需一种单独的提交协议,这种要求变得很明显,通过该协议每天接受的记录将达到上千个,峰值时期更将达到每周100,000个提交量。 提交过程也是国际活动的一部分,向三个国际性协作数据库中的任一个提交的记录几天后都将在另两个数据库中出现,然后这些序列记录将被许多研究组和研究中心传送到世界范围,其中有些研究者再格式化这些记录以适合他们的数据库和他们的程序使用。因此仅仅提交序列数据到这三个数据库之一,研究者们能够避免给这三个地方的数据库维护人员带来任何可能的重复工作。 本章节详细介绍了将DNA序列及其注解提交到公共数据库的过程,包括提交方法、工具和协议,并讨论了提交过程的重要性和影响。