SAM/BAM文件格式标签详解
需积分: 33 182 浏览量
更新于2024-08-05
收藏 338KB PDF 举报
"bam文件标签含义.pdf"
在生物信息学领域,BAM(Binary Alignment/Map)文件是一种用于存储高通量测序数据比对结果的高效二进制格式,它是SAM(Sequence Alignment/Map)文件的压缩版本。SAM文件格式规范定义了如何组织和表示这些比对记录,包括可选字段,而BAM文件则提供了更紧凑的存储方式。这个文档——“BAM文件标签含义.pdf”——详细解释了BAM文件中各种预定义的标准标签及其含义。
文档中提到了“Optional fields”,这些字段通常以TAG:TYPE:VALUE的形式显示,其中TYPE可以是以下六种类型之一:
1. A(字符):单个字符数据。
2. B(通用数组):一般形式的数组数据。
3. f(浮点数):实数或浮点数值。
4. H(十六进制数组):十六进制表示的数组。
5. i(整数):整数数据。
6. Z(字符串):字符串数据。
在预定义的标准标签中,有以下几个关键的标签举例:
- AM:i 类型,表示模板独立的最小映射质量。这个质量分数是不考虑模板结构时,所有读段中的最低映射质量。
- AS:i 类型,表示对齐得分。这是一个基于比对算法的分数,反映了序列与参考序列匹配的程度。
除了这些,文档还可能涵盖其他标签,如:
- NM:i 类型,表示序列修饰数,即与参考序列的差异数目。
- MD:Z 类型,提供了无质量值的序列差异描述,用于快速计算序列差异。
- cigar:Z 类型,CIGAR(Compact Idiosyncratic Gapped Alignment Report)字符串,描述了读段在参考序列上的比对情况,包括匹配、插入、删除等操作。
文档还讨论了创建新标签的约定,以确保兼容性和一致性。当研究人员或开发者需要扩展格式来包含自定义信息时,这些约定是至关重要的。
总结来说,“bam文件标签含义.pdf”是关于如何理解和解析BAM文件中附加信息的重要指南,对于处理和分析高通量测序数据的生物信息学家和科研人员来说,这份文档是不可或缺的参考资料。通过深入理解这些标签,用户能够更有效地分析比对数据,进行基因组分析、变异检测以及后续的生物学研究。
2015-07-29 上传
2021-10-29 上传
2021-08-03 上传
2024-11-18 上传
2024-11-18 上传
2024-11-18 上传
风风是超人
- 粉丝: 36
- 资源: 7
最新资源
- 基于Python和Opencv的车牌识别系统实现
- 我的代码小部件库:统计、MySQL操作与树结构功能
- React初学者入门指南:快速构建并部署你的第一个应用
- Oddish:夜潜CSGO皮肤,智能爬虫技术解析
- 利用REST HaProxy实现haproxy.cfg配置的HTTP接口化
- LeetCode用例构造实践:CMake和GoogleTest的应用
- 快速搭建vulhub靶场:简化docker-compose与vulhub-master下载
- 天秤座术语表:glossariolibras项目安装与使用指南
- 从Vercel到Firebase的全栈Amazon克隆项目指南
- ANU PK大楼Studio 1的3D声效和Ambisonic技术体验
- C#实现的鼠标事件功能演示
- 掌握DP-10:LeetCode超级掉蛋与爆破气球
- C与SDL开发的游戏如何编译至WebAssembly平台
- CastorDOC开源应用程序:文档管理功能与Alfresco集成
- LeetCode用例构造与计算机科学基础:数据结构与设计模式
- 通过travis-nightly-builder实现自动化API与Rake任务构建