ANNOVAR 根据snplist 可以做什么 给个例子
时间: 2024-05-31 12:07:40 浏览: 133
ANNOVAR可以根据输入的SNP列表进行注释,包括注释SNP的功能、位置、突变类型等信息。例如,给定一个SNP列表文件,包含rs号、染色体位置、参考碱基和变异碱基,可以使用ANNOVAR注释这些SNP的功能和位置信息。注释结果可以输出为文本文件,包括每个SNP的注释信息、功能、影响等。这些注释信息可以用于基因组学研究、疾病相关性分析等应用。
相关问题
ANNOVAR 根据snplist 可以做什么
ANNOVAR是一个用于注释基因变异的软件。当给定一个SNP列表时,ANNOVAR可以根据基因组位置和参考基因组信息,对这些SNPs进行注释,包括:
1. 基因组位置:SNP在参考基因组的位置,包括染色体、起始位置和终止位置。
2. 突变类型:SNP的突变类型,如单核苷酸多态性(SNP)、插入、缺失、复合杂合等。
3. 参考和替代碱基:SNP的参考碱基和替代碱基。
4. 功能注释:SNP所在基因的功能注释,如编码蛋白质、RNA或调节元件。
5. 保守性分析:SNP在多个物种中的保守性分析。
6. 人群频率:SNP在不同人群中的频率。
7. dbSNP ID:SNP在dbSNP数据库中的ID。
8. 疾病相关性:SNP与不同疾病的相关性分析。
通过这些注释信息,ANNOVAR可以帮助研究者更深入地理解SNP对基因功能和疾病发生的影响,为进一步的研究提供重要参考。
ANNOVAR 根据snplist 获取基因组位置信息 给个例子
假设我们有一个 SNP 列表文件,其中包含以下三个 SNP:
```
rs1000001
rs1000002
rs1000003
```
我们可以使用 ANNOVAR 中的 `annotate_variation.pl` 脚本来获取这些 SNP 的基因组位置信息。假设 ANNOVAR 安装在 `/path/to/annovar` 目录中,我们可以运行以下命令:
```
/path/to/annovar/annotate_variation.pl -buildver hg19 -downdb -webfrom annovar snp138 /path/to/snp_list.txt /path/to/output_dir/
```
该命令会将 SNP 列表文件 `/path/to/snp_list.txt` 中的 SNP 下载到本地,并将它们注释为 hg19 版本的基因组位置信息。注释结果将被保存在 `/path/to/output_dir/` 目录中的多个文件中,其中最重要的是 `*.hg19_multianno.txt` 文件,其中包含了所有 SNP 的注释信息。
例如,如果 `rs1000001` 的基因组位置在 chr1:10000,`rs1000002` 的基因组位置在 chr2:20000,`rs1000003` 的基因组位置在 chr3:30000,那么 `*.hg19_multianno.txt` 文件的内容可能如下所示:
```
Chr Start End Ref Alt Func.refGene Gene.refGene GeneDetail.refGene ExonicFunc.refGene AAChange.refGene avsnp138 SIFT_score SIFT_pred Polyphen2_HDIV_score Polyphen2_HDIV_pred Polyphen2_HVAR_score Polyphen2_HVAR_pred LRT_score LRT_pred MutationTaster_score MutationTaster_pred MutationAssessor_score MutationAssessor_pred FATHMM_score FATHMM_pred RadialSVM_score RadialSVM_pred LR_score LR_pred VEST3_score CADD_raw CADD_phred DANN_score fathmm-MKL_coding_score fathmm-MKL_coding_pred MetaSVM_score MetaSVM_pred MetaLR_score MetaLR_pred integrated_fitCons_score integrated_confidence_value GERP++_RS phyloP46way_placental phastCons46way_placental SiPhy_29way_logOdds
chr1 10000 10000 T A exonic gene1 . nonsynonymous SNV gene1:NM_001 rs1000001 0.05 tolerated 0.20 possibly damaging 0.10 possibly damaging 0.02 deleterious 0.84 disease causing 0.95 deleterious 0.91 deleterious 0.75 deleterious 0.04 tolerated 0.12 tolerated 0.10 deleterious 0.99 deleterious 0.85 tolerated 0.08 tolerated 0.05
chr2 20000 20000 C G exonic gene2 . synonymous SNV gene2:NM_002 rs1000002 . . . . . . . . . . . . . . . . . . . . . 0.95 0.05 0.97 -0.10
chr3 30000 30000 A G intronic gene3 . . . rs1000003 . . . . . . . . . . . . . . . . . . . . . . 0.90 0.15 0.90 0.25
```
需要注意的是,注释结果中的一些列可能会因为 SNP 的基因组位置而缺失或者为空。例如,`rs1000002` 的注释结果中,`SIFT_score`、`SIFT_pred`、`Polyphen2_HDIV_score`、`Polyphen2_HDIV_pred`、`Polyphen2_HVAR_score`、`Polyphen2_HVAR_pred`、`LRT_score`、`LRT_pred`、`MutationTaster_score`、`MutationTaster_pred`、`MutationAssessor_score`、`MutationAssessor_pred`、`FATHMM_score`、`FATHMM_pred`、`RadialSVM_score`、`RadialSVM_pred`、`LR_score`、`LR_pred`、`VEST3_score`、`CADD_raw`、`CADD_phred`、`DANN_score`、`fathmm-MKL_coding_score`、`fathmm-MKL_coding_pred`、`MetaSVM_score`、`MetaSVM_pred`、`MetaLR_score`、`MetaLR_pred`、`integrated_fitCons_score`、`integrated_confidence_value`、`GERP++_RS`、`phyloP46way_placental`、`phastCons46way_placental`、`SiPhy_29way_logOdds` 这些列都为空,这是因为该 SNP 的位置在一个不同于 `exonic` 的注释区域。
阅读全文