ANNOVAR 根据snplist 获取基因组位置信息 给个例子并解释
时间: 2024-06-12 14:05:34 浏览: 10
假设我们有一个SNP列表,其中包含以下三个SNP:
```
rs10001
rs10002
rs10003
```
我们可以使用ANNOVAR工具获取这些SNP的基因组位置信息。具体命令如下:
```
annotate_variation.pl -downdb -buildver hg19 -webfrom annovar snp138 -outfile snp138
```
这个命令会从ANNOVAR网站下载并安装snp138数据库。然后,我们可以使用以下命令将SNP列表与snp138数据库匹配:
```
annotate_variation.pl -buildver hg19 -downdb -webfrom annovar -snpfile snplist.txt -outfile snplist_annovar snp138
```
其中,snplist.txt是包含上述三个SNP的文件。运行上述命令后,ANNOVAR会将这些SNP的基因组位置信息保存到一个名为snplist_annovar.hg19_multianno.txt的文件中。
对于每个SNP,文件中会列出其所在的染色体、起始位置、终止位置、参考等位基因和可变等位基因。例如,对于rs10001,文件中的一行可能如下所示:
```
chr1 1000000 1000000 C T rs10001 0 0 0 0 0 0 0 0 0 0 0 0 C/T . . . . . . . . . . .
```
在这个示例中,rs10001位于染色体1上的位置1000000,参考等位基因为C,可变等位基因为T。