Awk 如何抽出文件中第10列=1并且第20列=5的数据,其中前十列或者11列到14列有中文
时间: 2024-03-26 15:40:18 浏览: 80
可以使用 awk 命令结合正则表达式来实现这个功能。具体命令如下:
```
awk -F '\t' '$10=="1" && $20=="5" && ($1~/[[:alnum:]]/ || $11~/[[:alnum:]]/ || $12~/[[:alnum:]]/ || $13~/[[:alnum:]]/ || $14~/[[:alnum:]]/){print}' 文件名
```
解释一下各个部分:
- `-F '\t'`:指定分隔符为制表符。
- `$10=="1" && $20=="5"`:判断第10列是否为1且第20列是否为5。
- `($1~/[[:alnum:]]/ || $11~/[[:alnum:]]/ || $12~/[[:alnum:]]/ || $13~/[[:alnum:]]/ || $14~/[[:alnum:]]/)`:判断前十列或者11-14列是否包含字母或数字。其中 `~/[[:alnum:]]/` 表示匹配字母或数字的正则表达式。
- `{print}`:如果符合要求,则打印整行数据。
注意:以上命令中的制表符 `\t` 可能在不同平台下表现不同,可以根据实际情况调整分隔符。另外,如果文件不是以制表符分隔的,需要使用 `-F` 参数指定正确的分隔符。
相关问题
awk分组多列求和
可以使用awk命令的数组和循环来实现多列求和并分组。
假设有一个文件data.txt,数据如下:
```
A 10 20
B 15 25
A 5 15
B 20 30
```
其中第一列是分组列,第二列和第三列是需要求和的列。
使用以下命令可以实现对第二列和第三列的求和,并按照第一列进行分组:
```
awk '{a[$1]+=$2;b[$1]+=$3} END{for(i in a) print i,a[i],b[i]}' data.txt
```
输出结果为:
```
A 15 35
B 35 55
```
其中,a[$1]和b[$1]分别表示第一列的值为键值的第二列和第三列的累加和。最后循环输出结果时,分别输出键值和对应的两列的累加和。
阅读全文
相关推荐

















