blastn按照相似度98%和覆盖度80%去除相似的核酸序列,命令举例 。
时间: 2024-09-30 10:03:37 浏览: 43
BLAST相似序列的数据库搜索.pdf
Blastn是一种用于寻找核酸序列之间相似性的工具,它通常用于比较DNA或RNA序列。如果你想要使用blastn来去除基于相似度98%和覆盖度80%的重复序列,你需要设置合适的参数。在NCBI的Command Line Blast+工具中,这可以通过`-outfmt`选项和自定义的格式字符串来完成,同时使用`-max_target_seqs`控制返回的最大相似序列数。
例如,一个基本的blastn命令可能会像这样:
```bash
blastn -query your_sequence.fasta -db reference_database.fasta \
-outfmt "6 std sscs" \
-max_target_seqs 1 \
-perc_identity 98.0 \
-coverage 80.0
```
这里解释一下各个参数:
- `-query`: 查询序列文件
- `-db`: 对比数据库
- `outfmt 6`: 输出格式,包括标题信息、得分、E值等,以及SSC(Sequence Spanning Clusters)模式,有助于处理高相似度的序列
- `-max_target_seqs 1`: 只保留一个最相似的匹配
- `-perc_identity 98.0`: 设置识别的最低同源性百分比为98%
- `-coverage 80.0`: 设置最低覆盖度为80%
请注意,实际操作前可能需要根据你的具体需求调整参数,并且确保你的输入数据格式正确。
阅读全文