序列拼接与生物信息学工具实操指南

需积分: 33 112 浏览量更新于2024-08-08 收藏 6.26MB PDF 举报

本资源是一本实用的生物信息学技术书籍，名为《生物信息学实用技术系列丛书--常用生物数据分析软件V2.0》，由北京华大基因研究中心编著。该书详细介绍了在Unix/Linux操作系统环境下进行生物数据分析的一系列工具和技术，涵盖了从数据基本处理到高级分析的各个方面。章节2.5专门讨论了序列拼接，这是生物信息学中的关键步骤之一，用于将短读测序片段（ESTs）合并成更长、连续的序列，提高组装质量和准确性。具体介绍的两个主要拼接工具是： 1. Phrap： - 参数：-phrap用于拼接EST，提供一致性序列。其中，-phrap_minmatch设置了最小匹配长度默认为30bp，确保足够长的片段连接；-phrap_minscore规定了匹配得分的最低阈值，默认为30；-phrap_stringency则指定了匹配区域的同源性要求，默认为95%。 - 结果示例：通过Phrap进行聚类和拼接后，会得到多个文件，如WTEA.CleanEST.seq.clus（聚类结果）、WTEA _Cluster_Assembly.fasta（至少包含两个EST的拼接序列）和WTEA _Cluster_Assembly.list（记录每类拼接序列及其对应的EST）等。同时，还会有一类单独EST的文件，如WTEA _Sinlets.fasta和WTEA _Sinlets.list。 2. Cap3： - Cap3是另一种常用的序列拼接工具，虽然在这个章节没有详细列出参数，但通常它也涉及相似的参数设置，用于处理不同长度和质量的EST，以生成高质量的组装。书中还涉及到其他关键工具，如序列比对（Clustalw、MUSCLE、HMMER等）、基因组注释（如RepeatMasker、Trf、rRNA分析等）、SNP分析（Polyphred、SNPdetector等）以及进化分析（Phylip、PAML等）。这些工具和方法对于生物学研究，特别是遗传学、基因组学和分子生物学领域的研究人员来说，都是非常重要的实践工具。这本书提供了全面的生物信息学工具集，适合那些需要掌握Linux环境下的生物数据处理和分析技能的专业人员，无论是初级学习者还是经验丰富的研究人员都能从中受益。通过学习和实践书中的内容，读者可以提升自己在基因组学项目中的数据处理能力，推动科学研究的进步。

沃娃

粉丝: 31
资源: 3952

序列拼接与生物信息学工具实操指南

i.MX_Virtualization_User's_Guide.pdf

Citrix镜像 NSVPX-ESX-12.1-61.19_nc_64.zip

VMware-ovftool-4.4.0-15722219-win.x86_64.rar

合并数据与生物信息学工具：i.mx_virtualization_user's_guide实例

LPC-Vocoder-master.zip_LPC vocoder_LPC-Vocoder-master_termnfv_vo

Intel_IA-32指令集.zip_IA-32_IA-32.CHM_IA-32指令集_IA32指令集_inter_ia-32

Red_Hat_Virtualization-4.3-Administration_Guide-en-US.pdf

irq-gic-v3.rar_Only

Network-data-interception.zip_网络编程_Visual_Basic_

Switch-Fabric.rar_fabric_switch_switch fabric

最新资源