NCBI BLAST教程:快速序列比对与应用

5星 · 超过95%的资源 需积分: 34 6 下载量 23 浏览量 更新于2024-09-13 收藏 282KB DOC 举报
"本文将详细介绍如何使用BLAST,一个由NCBI开发的生物序列相似性搜索工具,以及其不同版本的功能和应用。" BLAST,全称为Basic Local Alignment Search Tool,是生物信息学中广泛使用的工具,用于快速查找核酸或蛋白质序列与大型数据库之间的相似性。NCBI(美国国立医学图书馆的国家生物技术信息中心)是BLAST的主要开发者和维护者,致力于通过创新的信息技术促进对健康和疾病基础分子及遗传过程的理解。 1. **Gapped BLAST (2.0)** Gapped BLAST允许在比对中插入缺口,以适应不同长度的序列。它基于随机序列的先验模拟来评估统计显著性。虽然现在可能需要通过QBLAST访问,但Gapped BLAST对于处理需要考虑序列间不完全匹配的情况至关重要。 2. **QBLAST** QBLAST是一种先进的检索系统,用户可以自定义检索参数,并以多种格式输出结果。同时,它优化了NCBI的计算资源使用,提高了服务效率。自1999年秋季以来,所有BLAST搜索都通过QBLAST进行。 3. **PSI-BLAST (Position-Specific Iterative BLAST)** 这是针对蛋白质查询的迭代搜索工具,通过累积统计显著的比对形成多序列比对,进而构建位置特异的得分矩阵,用于搜索数据库以找到更多显著比对。该过程可以重复,直到找不到新的显著比对为止,特别适用于发现蛋白质家族和结构域。 4. **PHI-BLAST (Pattern Hit Initiated BLAST)** PHI-BLAST旨在寻找具有特定模式的蛋白质序列,这对于模式识别和新基因发现特别有用。 5. **BLAST Two Sequences** 这是一个简单版本的BLAST,用于比较两条核酸或蛋白质序列,生成一对一的DNA-DNA或蛋白质-蛋白质序列比对,适用于基本的序列对齐需求。 6. **IgBLAST** IgBLAST是专为分析GenBank中的免疫球蛋白序列设计的,支持使用blastp或blastn搜索nr数据库或免疫球蛋白生殖系变异区,这对于免疫学研究非常有价值。 使用BLAST时,用户通常需要提供查询序列,选择合适的数据库(如nr、nt等),并设置阈值和参数,如E值、打分矩阵等。搜索完成后,结果会显示相似序列、相似度分数、E值和比对片段。这些信息对于研究人员理解序列功能、进化关系和潜在的生物学意义至关重要。 BLAST及其衍生工具在生物信息学领域扮演着重要角色,它们提供了高效、灵活的方法来探索和解析生物序列数据,是科研人员日常工作中不可或缺的工具。