trimmomatic中单端与双端有哪些可选参数是分别特有的,单端与双端分别可以使用那些可选参数,那些参数不可以混用?接头文件如何制作?制作接头文件注意事项有哪些?比对序列是什么?如何制作比对序列文件?
时间: 2024-05-06 15:22:00 浏览: 78
1. 可选参数
在trimmomatic中,单端和双端序列处理有一些可选参数是分别特有的,例如:
单端序列特有参数:
- SE:单端序列输入格式;
- SLIDINGWINDOW:滑动窗口的大小和平均质量值的阈值;
- TRAILING:剪切序列末端低质量的碱基;
- HEADCROP:剪切序列开头低质量的碱基;
- MINLEN:保留序列的最小长度;
- TOPHRED33:指定Phred33质量值体系。
双端序列特有参数:
- PE:双端序列输入格式;
- PHRED33/PHRED64:指定Phred33或Phred64质量值体系;
- ILLUMINACLIP:指定Illumina adapter的序列文件和阈值;
- LEADING:剪切序列开头低质量的碱基;
- CROP:剪切序列末端低质量的碱基;
- MINLEN:保留序列的最小长度。
单端和双端序列都可以使用的参数包括:
- THREADS:指定线程数;
- AVGQUAL:指定平均质量值的阈值。
需要注意的是,单端和双端序列的可选参数不能混用,否则会出错。
2. 制作接头文件的注意事项
接头文件用于去除测序过程中引入的adapter序列,需要注意以下几点:
- adapter序列需要根据实验数据来确定;
- adapter序列需要从测序厂商的网站上下载;
- adapter序列需要按照trimmomatic的格式来进行制作;
- adapter序列制作完成后,需要在trimmomatic的命令中指定。
例如,制作Illumina adapter序列的命令如下:
```
java -jar trimmomatic-0.39.jar illuminaclip adapters.fa:2:30:10
```
其中,adapters.fa是adapter序列文件,2表示最少重复2次,30表示最小匹配长度为30,10表示最大允许的错误率为10%。
3. 比对序列和比对序列文件的制作
比对序列是用于比对分析的参考序列,可以从NCBI等数据库中下载。比对序列文件需要根据比对工具的要求来制作,例如,使用Bowtie2进行比对,需要将比对序列文件建立索引,命令如下:
```
bowtie2-build reference.fa reference
```
其中,reference.fa是比对序列文件,reference是建立的索引文件名。建立索引后,就可以使用Bowtie2进行比对分析了。
阅读全文