探索BWA-PSSM:古代DNA测序中的概率短读映射器
需积分: 10 31 浏览量
更新于2024-12-01
收藏 275KB ZIP 举报
资源摘要信息:"bwa-pssm是一款基于Burrows-Wheeler变换的算法,主要功能是将受损的DNA序列转换为概率短序列模型(PSSM),从而用于古代DNA测序中的比对分析。该程序的使用与著名的基因组比对工具BWA非常相似,但因设计有所差异,因此在参数配置上需特别注意。官方推荐用户在官方网站上查找更详尽的指导信息。bwa-pssm的安装需要依赖于gdsl库,因此在安装前必须确保该库已经被正确安装。安装后,通过简单的‘make’命令即可完成bwa-pssm的编译工作。至于将原始fastq格式的DNA测序数据转换为PSSM格式,bwa-pssm提供了一个名为fastq2wm.py的Python脚本,用户可以直接使用该脚本对fastq文件进行处理。在处理过程中,如果遇到的是64碱基对的fastq文件,则需要通过‘-q 64’选项进行指定。该脚本提供了一种方法来修改退化碱基的概率,这种方法在古代DNA的研究中尤其重要。"
1. Burrows-Wheeler变换(BWT):
Burrows-Wheeler变换是一种数据压缩算法,广泛应用于文本压缩及字符串匹配问题中。该变换能够将长序列中重复的字符串放置到接近的位置,从而使数据在变换后具有一定的规律性,便于后续的压缩或模式匹配操作。
2. 短读映射器(Short Read Mapping):
短读映射器是一种生信工具,用于将高通量测序技术产生的短读序列映射到参考基因组上。通过这种映射,研究者能够定位短读在基因组上的具体位置,从而进行基因变异检测、基因表达分析等。
3. BWA(Burrows-Wheeler Alignment Tool):
BWA是一个用于比对序列到参考基因组的软件工具。它特别适合处理长读和短读,BWA使用BWT算法来加速序列比对过程。
4. 概率短读映射器(Probability Short Read Mapper):
概率短读映射器与传统的序列比对工具不同,它在比对过程中会考虑序列的不确定性,例如碱基退化(base degradation),从而赋予不同比对位置以概率值而非绝对匹配。
5. 古代DNA测序(Ancient DNA Sequencing):
古代DNA测序是对从历史遗迹、古生物标本等来源的古代生物体的DNA进行测序分析。古代DNA常常存在大量的化学退化,如碱基的损耗和脱氨基化,这些都会影响比对的准确性。
6. Python脚本在生信分析中的应用:
在生物信息学分析中,Python脚本经常被用来处理数据,如将fastq格式的测序数据转换为其他格式,或者进行基本的序列处理和分析。
7. fastq格式:
fastq是一种用于存储生物序列以及质量分数信息的文件格式。fastq文件包含了序列标识符、DNA序列和与之对应的每个碱基质量得分。
8. 参考基因组(Reference Genome):
参考基因组是一套完整的基因组序列,通常来自于一个或多个代表性的个体。它是DNA序列比对分析的标准参照,用于映射短读序列。
9. gdsl库:
gdsl库(Genome Data Structures Library)是处理基因组数据的库,提供了对BWT及其相关数据结构的高效操作。它是构建像BWA这样的基因组分析工具所必需的底层支持。
10. make命令:
make是一个常用的构建工具,用于自动化编译程序。在软件开发过程中,通过编写一个makefile文件来定义程序的编译规则,然后使用make命令来根据这些规则编译程序。
2021-05-10 上传
2021-06-10 上传
2021-02-10 上传
2021-02-23 上传
2021-03-21 上传
2021-04-30 上传
2021-04-29 上传
2021-05-03 上传
点击了解资源详情
陈崇礼
- 粉丝: 51
- 资源: 4683
最新资源
- upptime:我的外部监控工具
- HTMLprocessor:HTML 处理和指标提取
- Draft Wed Aug 15 15:32:42 CST 2018-数据集
- Python库 | datatools_mikdowd-0.0.5-py3-none-any.whl
- 基于 C++大地测量学之坐标转化及坐标系转换
- modcopy-开源
- pyg_lib-0.3.0+pt20cpu-cp311-cp311-linux_x86_64whl.zip
- intern_szut:intern_szut网站
- 森兰变频器上位机控制软件SlMonitorV2.1.zip
- Crawling_Project:使用python,BeautifulSoup
- ParkinsonsPredictor:使用两种不同的分类策略来尝试预测某人是否患有帕金森病
- BPMVue:BPM的Vue
- qiyemingpian:nodeJS+express+mysql后端开发教程-企业名片小程序后端开发
- 147. 2019抖音数据报告.rar
- lesson-1
- racket2nix:取得一个info.rkt文件,生成一个info.nix文件