awk -F '\t' '{a[NR]=$1;d[$1]=$2;b+=$2}END{for(i=1;i<=NR;i++){c+=d[a[i]];if(c/b>0.02)print a[i]}}'
时间: 2024-04-19 08:28:22 浏览: 18
这段`awk`命令用于计算累积频率,并找到第一个累积频率超过总频率的2%的某个值,并将其打印输出。
让我们逐步解释这个命令:
1. `-F '\t'`:设置字段分隔符为制表符。
2. `{a[NR]=$1;d[$1]=$2;b+=$2}`:将第一个字段(长度)存储在数组`a`中,将第二个字段(频率)存储在数组`d`中,并将频率累加到变量`b`中。
3. `END{for(i=1;i<=NR;i++){c+=d[a[i]];if(c/b>0.02)print a[i]}}`:在处理完所有行后,在`END`块中循环数组`a`,通过累加数组`d`的值到变量`c`中,检查累积频率是否超过总频率的2%。如果超过,则打印当前长度。
这段代码的目的是找到累积频率超过总频率2%的某个长度,并将其打印输出。
请注意,这只是代码的解释,并不会真正执行代码。如果您还有其他问题,请随时提问!
相关问题
tlr_temp=`ls 2_sequences/demux_no_primer_${libname}_qza/*_R2_* | xargs -i zcat {} | awk 'NR%4==2{print length}' | sort -n| uniq -c |awk '{print $2"\t"$1}' | awk -F '\t' '{a[NR]=$1;d[$1]=$2;b+=$2}END{for(i=1;i<=NR;i++){c+=d[a[i]];if(c/b>0.02)print a[i]}}' |head -n 1 `
这段代码是用于处理DNA测序数据的。首先,它使用`ls`命令获取文件夹`2_sequences/demux_no_primer_${libname}_qza/`中所有以`_R2_`结尾的文件的路径。然后,使用`xargs`命令将这些文件路径传递给`zcat`命令,并解压缩这些文件。接下来,使用`awk`命令来处理解压缩后的文件,首先筛选出每个序列的长度(第2行),然后按长度进行排序和去重,并统计每个长度出现的次数。接着,使用`awk`命令再次处理数据,将长度和出现次数以制表符分隔的形式输出。最后,使用`awk`命令计算累积频率,并找到第一个累积频率超过总频率2%的长度,并打印输出。
请注意,我只是解释了代码的功能,并不会真正执行代码。如果您还有其他问题,请随时提问!
解释以下命令的功能。 awk -F',' '{print $3}' test.txt awk -F',' '{sum += $3} END {print sum}' test.txt awk -F ',' '{print $1, $(NF-1)}' test.txt awk -F ',' '{ print toupper($2) }' test.txt awk '/Purple/ {print}' test.txt awk -F ',' 'NR % 2 == 1 {print $1}' test.txt awk -F ',' '$2 == "Grape" || $4 == "Red" {print $2,$4}' test.txt awk -F ',' '{if ($3 > 15) print $1,$2,$3; else print "---"}' test.txt awk -F',' '{arr[$4]+=$3} END {for (i in arr) print i, arr[i]}' test.txt awk -F',' '{printf "$%.2f\n", $3}' test.txt
1. 第一条命令的功能是从名为 test.txt 的文件中提取第三列数据并输出。
2. 第二条命令的功能是计算名为 test.txt 的文件中第三列数据的总和并输出。
3. 第三条命令的功能是从名为 test.txt 的文件中提取第一列和倒数第二列数据并输出。
4. 第四条命令的功能是将名为 test.txt 的文件中第二列数据全部转换为大写字母并输出。
5. 第五条命令的功能是从名为 test.txt 的文件中查找包含 "Purple" 字符串的行并输出。
6. 第六条命令的功能是从名为 test.txt 的文件中提取奇数行的第一列数据并输出。
7. 第七条命令的功能是从名为 test.txt 的文件中查找第二列数据为 "Grape" 或第四列数据为 "Red" 的行并输出这两列数据。
8. 第八条命令的功能是从名为 test.txt 的文件中提取第一列、第二列和第三列数据,如果第三列数据大于 15 则输出,否则输出 "---"。
9. 第九条命令的功能是从名为 test.txt 的文件中计算每个第四列数据的总和,并输出这些数据及其对应的总和。
10. 第十条命令的功能是从名为 test.txt 的文件中提取第三列数据并将其格式化为 $xx.xx 的形式并输出。
相关推荐
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)