tlr_temp=`ls 2_sequences/demux_no_primer_${libname}_qza/*_R2_* | xargs -i zcat {} | awk 'NR%4==2{print length}' | sort -n| uniq -c |awk '{print $2"\t"$1}' | awk -F '\t' '{a[NR]=$1;d[$1]=$2;b+=$2}END{for(i=1;i<=NR;i++){c+=d[a[i]];if(c/b>0.02)print a[i]}}' |head -n 1 `
时间: 2024-04-19 22:28:30 浏览: 113
jtag.rar_jtag_msp430_msp430 原理图_仿真器_仿真器原理图
这段代码是用于处理DNA测序数据的。首先,它使用`ls`命令获取文件夹`2_sequences/demux_no_primer_${libname}_qza/`中所有以`_R2_`结尾的文件的路径。然后,使用`xargs`命令将这些文件路径传递给`zcat`命令,并解压缩这些文件。接下来,使用`awk`命令来处理解压缩后的文件,首先筛选出每个序列的长度(第2行),然后按长度进行排序和去重,并统计每个长度出现的次数。接着,使用`awk`命令再次处理数据,将长度和出现次数以制表符分隔的形式输出。最后,使用`awk`命令计算累积频率,并找到第一个累积频率超过总频率2%的长度,并打印输出。
请注意,我只是解释了代码的功能,并不会真正执行代码。如果您还有其他问题,请随时提问!
阅读全文