trimmomatic 如何使用及参数命令,并举例子
时间: 2023-12-19 08:04:27 浏览: 264
Trimmomatic 是一个常用的序列读取和修剪工具,可以用于去除低质量序列、去除 adapter 序列等。其使用方法和参数命令如下:
使用方法:
```
java -jar trimmomatic.jar [PE/SE] -phred33/-phred64 input_forward.fq.gz input_reverse.fq.gz output_forward_paired.fq.gz output_forward_unpaired.fq.gz output_reverse_paired.fq.gz output_reverse_unpaired.fq.gz ILLUMINACLIP:adapter.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36
```
参数命令:
- PE/SE:指定是单端还是双端数据
- -phred33/-phred64:指定测序数据的质量值编码方式
- input_forward.fq.gz/input_reverse.fq.gz:输入的前向和反向测序数据
- output_forward_paired.fq.gz/output_forward_unpaired.fq.gz/output_reverse_paired.fq.gz/output_reverse_unpaired.fq.gz:经过修剪后的输出数据,分别为前向配对序列、前向未配对序列、反向配对序列和反向未配对序列
- ILLUMINACLIP:adapter.fa:2:30:10:去除 adapter 序列,其中 adapter.fa 为 adapter 序列文件,2 表示最小匹配长度,30 表示最大错配数,10 表示简单重复序列的最大长度
- LEADING:3:去除序列开头低质量的碱基,指定阈值为 3
- TRAILING:3:去除序列末尾低质量的碱基,指定阈值为 3
- SLIDINGWINDOW:4:15:去除滑动窗口中低质量的碱基,窗口大小为 4,平均质量阈值为 15
- MINLEN:36:去除长度小于 36 的序列
举个例子,假设我们有一对双端测序数据文件 input_forward.fq.gz 和 input_reverse.fq.gz,adapter 序列文件为 adapter.fa,我们想要使用 Trimmomatic 进行修剪和去除 adapter 序列,可以使用以下命令:
```
java -jar trimmomatic.jar PE -phred33 input_forward.fq.gz input_reverse.fq.gz output_forward_paired.fq.gz output_forward_unpaired.fq.gz output_reverse_paired.fq.gz output_reverse_unpaired.fq.gz ILLUMINACLIP:adapter.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36
```
阅读全文