序列拼接与生物信息学工具实操指南
需积分: 33 112 浏览量
更新于2024-08-08
收藏 6.26MB PDF 举报
本资源是一本实用的生物信息学技术书籍,名为《生物信息学实用技术系列丛书--常用生物数据分析软件V2.0》,由北京华大基因研究中心编著。该书详细介绍了在Unix/Linux操作系统环境下进行生物数据分析的一系列工具和技术,涵盖了从数据基本处理到高级分析的各个方面。
章节2.5专门讨论了序列拼接,这是生物信息学中的关键步骤之一,用于将短读测序片段(ESTs)合并成更长、连续的序列,提高组装质量和准确性。具体介绍的两个主要拼接工具是:
1. Phrap:
- 参数:-phrap用于拼接EST,提供一致性序列。其中,-phrap_minmatch设置了最小匹配长度默认为30bp,确保足够长的片段连接;-phrap_minscore规定了匹配得分的最低阈值,默认为30;-phrap_stringency则指定了匹配区域的同源性要求,默认为95%。
- 结果示例:通过Phrap进行聚类和拼接后,会得到多个文件,如WTEA.CleanEST.seq.clus(聚类结果)、WTEA _Cluster_Assembly.fasta(至少包含两个EST的拼接序列)和WTEA _Cluster_Assembly.list(记录每类拼接序列及其对应的EST)等。同时,还会有一类单独EST的文件,如WTEA _Sinlets.fasta和WTEA _Sinlets.list。
2. Cap3:
- Cap3是另一种常用的序列拼接工具,虽然在这个章节没有详细列出参数,但通常它也涉及相似的参数设置,用于处理不同长度和质量的EST,以生成高质量的组装。
书中还涉及到其他关键工具,如序列比对(Clustalw、MUSCLE、HMMER等)、基因组注释(如RepeatMasker、Trf、rRNA分析等)、SNP分析(Polyphred、SNPdetector等)以及进化分析(Phylip、PAML等)。这些工具和方法对于生物学研究,特别是遗传学、基因组学和分子生物学领域的研究人员来说,都是非常重要的实践工具。
这本书提供了全面的生物信息学工具集,适合那些需要掌握Linux环境下的生物数据处理和分析技能的专业人员,无论是初级学习者还是经验丰富的研究人员都能从中受益。通过学习和实践书中的内容,读者可以提升自己在基因组学项目中的数据处理能力,推动科学研究的进步。
2019-07-31 上传
2022-07-13 上传
115 浏览量
点击了解资源详情
2022-09-23 上传
2022-09-20 上传
2020-06-05 上传
2022-09-23 上传
2021-08-11 上传
沃娃
- 粉丝: 31
- 资源: 3952
最新资源
- Angular实现MarcHayek简历展示应用教程
- Crossbow Spot最新更新 - 获取Chrome扩展新闻
- 量子管道网络优化与Python实现
- Debian系统中APT缓存维护工具的使用方法与实践
- Python模块AccessControl的Windows64位安装文件介绍
- 掌握最新*** Fisher资讯,使用Google Chrome扩展
- Ember应用程序开发流程与环境配置指南
- EZPCOpenSDK_v5.1.2_build***版本更新详情
- Postcode-Finder:利用JavaScript和Google Geocode API实现
- AWS商业交易监控器:航线行为分析与营销策略制定
- AccessControl-4.0b6压缩包详细使用教程
- Python编程实践与技巧汇总
- 使用Sikuli和Python打造颜色求解器项目
- .Net基础视频教程:掌握GDI绘图技术
- 深入理解数据结构与JavaScript实践项目
- 双子座在线裁判系统:提高编程竞赛效率