对转录组进行SNP调用时,应该怎样修改这一命令,特别是这里:--genotyping-mode DISCOVERY
时间: 2024-09-16 19:01:56 浏览: 72
在对转录组进行单核苷酸多态性 (Single Nucleotide Polymorphism, SNP) 调用时,`HaplotypeCaller` 命令需要针对转录本数据 (Transcriptome data) 进行一些调整。特别地,关于 `--genotyping-mode` 参数,如果你想要专注于转录本特定的SNPs,你应该将其设置为 "GENOTYPE_GIVEN_ALLELES" 或 "GENOTYPE_LIKELIHOODS"。
例如,如果你已经有了预先确定的候选SNP列表,可以使用 `GENOTYPE_GIVEN_ALLELES`,传递该列表给 `--alleles` 参数:
```bash
gatk HaplotypeCaller -R reference_transcripts.gtf -I transcriptome.bam --alleles candidate_snps.txt --genotyping_mode GENOTYPE_GIVEN_ALLELES --stand_call_conf 30 --emit_ref_confidence GVCF -O transcriptome_snps.vcf.gz
```
如果你需要计算每个位置的SNP可能性(而不是直接的二倍型),则选择 `GENOTYPE_LIKELIHOODS` 模式:
```bash
gatk HaplotypeCaller -R reference_transcripts.gtf -I transcriptome.bam --genotyping_mode GENOTYPE_LIKELIHOODS --stand_call_conf 30 --emit_ref_confidence GVCF -O transcriptome_likelihoods.vcf.gz
```
在这个例子中,`transcriptome.gtf` 替换了原命令中的基因组fasta,`candidate_snps.txt` 和 `transcriptome.bam` 分别代表转录本候选SNP列表和输入的BAM文件。
阅读全文