"NCBI-PDB数据库:序列采集、存储、查询"
170 浏览量
更新于2023-12-30
收藏 15MB PPTX 举报
本文总结的是一份名为"教你使用NCBI-PDB数据库(“序列”相关文档)共62张.pptx"的教学材料,该材料是Bioinformatics课程的一部分,于2009-2010年第一学期在苏州大学生物信息学课程中使用。主要探讨序列的采集、存储和查询方面的内容。
首先,讲座介绍了DNA测序的基本概念。其中指出,DNA的一次测序长度通常为500bp。为了测序大型染色体,常常将染色体打断成100kbp的片段,并将它们插入到Bacterial Artificial Chromosome (BAC)中。通过随机打断、克隆和组装,可以得到连续的序列(contig)。此外,还介绍了EST (Expressed sequence tag)测序的方法,该方法将细胞中的mRNA反转录为cDNA,并进行方向不定的测序。还提到了UniGene,它为每个基因创建唯一的标识符。
接下来,讲座详细介绍了序列数据的存储方法。讲座强调了NCBI-PDB数据库的重要性,该数据库是一个全球公认的生物信息学数据库。它以结构数据为主,但也包含了序列数据。讲座指出,NCBI-PDB数据库不仅存储了蛋白质和核酸序列数据,还提供了对这些数据的搜索和查询功能。
随后,讲座介绍了序列数据的文件格式。常见的序列文件格式包括FASTA和GenBank。FASTA格式是一种简单的文本格式,用于表示序列和序列注释。GenBank格式是一种更复杂的文件格式,包含了丰富的序列和注释信息,例如基因名称、序列特征和参考文献。
最后,讲座探讨了序列数据的查询方法。通过NCBI-PDB数据库提供的查询工具,可以根据关键词、序列相似性、蛋白质家族等进行搜索。此外,讲座介绍了一些常见的序列分析工具,例如BLAST和ClustalW。这些工具可以帮助研究人员进行序列比对、进化分析等。
总之,这份教学材料详细介绍了序列的采集、存储和查询方面的知识。通过使用NCBI-PDB数据库和各种序列文件格式,研究人员可以方便地存储、查询和分析序列数据,进而促进生物信息学领域的研究和发展。
188 浏览量
2024-11-01 上传
2022-11-15 上传
2022-11-14 上传
2021-09-21 上传
2021-10-23 上传
xinkai1688
- 粉丝: 389
- 资源: 8万+