ANNOVAR 根据snplist 获取基因组位置信息 给个例子
时间: 2024-05-05 11:15:33 浏览: 20
假设我们有一个 SNP 列表文件,其中包含以下三个 SNP:
```
rs1000001
rs1000002
rs1000003
```
我们可以使用 ANNOVAR 中的 `annotate_variation.pl` 脚本来获取这些 SNP 的基因组位置信息。假设 ANNOVAR 安装在 `/path/to/annovar` 目录中,我们可以运行以下命令:
```
/path/to/annovar/annotate_variation.pl -buildver hg19 -downdb -webfrom annovar snp138 /path/to/snp_list.txt /path/to/output_dir/
```
该命令会将 SNP 列表文件 `/path/to/snp_list.txt` 中的 SNP 下载到本地,并将它们注释为 hg19 版本的基因组位置信息。注释结果将被保存在 `/path/to/output_dir/` 目录中的多个文件中,其中最重要的是 `*.hg19_multianno.txt` 文件,其中包含了所有 SNP 的注释信息。
例如,如果 `rs1000001` 的基因组位置在 chr1:10000,`rs1000002` 的基因组位置在 chr2:20000,`rs1000003` 的基因组位置在 chr3:30000,那么 `*.hg19_multianno.txt` 文件的内容可能如下所示:
```
Chr Start End Ref Alt Func.refGene Gene.refGene GeneDetail.refGene ExonicFunc.refGene AAChange.refGene avsnp138 SIFT_score SIFT_pred Polyphen2_HDIV_score Polyphen2_HDIV_pred Polyphen2_HVAR_score Polyphen2_HVAR_pred LRT_score LRT_pred MutationTaster_score MutationTaster_pred MutationAssessor_score MutationAssessor_pred FATHMM_score FATHMM_pred RadialSVM_score RadialSVM_pred LR_score LR_pred VEST3_score CADD_raw CADD_phred DANN_score fathmm-MKL_coding_score fathmm-MKL_coding_pred MetaSVM_score MetaSVM_pred MetaLR_score MetaLR_pred integrated_fitCons_score integrated_confidence_value GERP++_RS phyloP46way_placental phastCons46way_placental SiPhy_29way_logOdds
chr1 10000 10000 T A exonic gene1 . nonsynonymous SNV gene1:NM_001 rs1000001 0.05 tolerated 0.20 possibly damaging 0.10 possibly damaging 0.02 deleterious 0.84 disease causing 0.95 deleterious 0.91 deleterious 0.75 deleterious 0.04 tolerated 0.12 tolerated 0.10 deleterious 0.99 deleterious 0.85 tolerated 0.08 tolerated 0.05
chr2 20000 20000 C G exonic gene2 . synonymous SNV gene2:NM_002 rs1000002 . . . . . . . . . . . . . . . . . . . . . 0.95 0.05 0.97 -0.10
chr3 30000 30000 A G intronic gene3 . . . rs1000003 . . . . . . . . . . . . . . . . . . . . . . 0.90 0.15 0.90 0.25
```
需要注意的是,注释结果中的一些列可能会因为 SNP 的基因组位置而缺失或者为空。例如,`rs1000002` 的注释结果中,`SIFT_score`、`SIFT_pred`、`Polyphen2_HDIV_score`、`Polyphen2_HDIV_pred`、`Polyphen2_HVAR_score`、`Polyphen2_HVAR_pred`、`LRT_score`、`LRT_pred`、`MutationTaster_score`、`MutationTaster_pred`、`MutationAssessor_score`、`MutationAssessor_pred`、`FATHMM_score`、`FATHMM_pred`、`RadialSVM_score`、`RadialSVM_pred`、`LR_score`、`LR_pred`、`VEST3_score`、`CADD_raw`、`CADD_phred`、`DANN_score`、`fathmm-MKL_coding_score`、`fathmm-MKL_coding_pred`、`MetaSVM_score`、`MetaSVM_pred`、`MetaLR_score`、`MetaLR_pred`、`integrated_fitCons_score`、`integrated_confidence_value`、`GERP++_RS`、`phyloP46way_placental`、`phastCons46way_placental`、`SiPhy_29way_logOdds` 这些列都为空,这是因为该 SNP 的位置在一个不同于 `exonic` 的注释区域。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![txt](https://img-home.csdnimg.cn/images/20210720083642.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)