linux 分组统计
时间: 2023-07-20 13:15:01 浏览: 137
Hive安装与部署并词频统计.docx
你可以使用命令行工具 `awk` 和 `sort` 来完成 Linux 分组统计的任务。假设你有一个名为 `data.txt` 的文本文件,它包含了一些数据,每行一个数据,其中每个数据有两个字段,用空格分隔。第一个字段是分组的名称,第二个字段是需要统计的数值。你可以使用以下命令来对数据进行分组统计:
```
awk '{a[$1] += $2} END {for (i in a) print i, a[i]}' data.txt | sort
```
这个命令的含义是:
- `awk '{a[$1] += $2} END {for (i in a) print i, a[i]}' data.txt`:使用 `awk` 对 `data.txt` 文件进行处理,对每个分组的名称,使用一个数组 `a` 来存储该分组对应的数值,最后输出每个分组的名称和对应的数值。
- `sort`:使用 `sort` 命令对输出结果进行排序,以便更好地查看结果。
执行以上命令后,你将会得到每个分组的名称和对应的数值,按照分组名称进行排序。
阅读全文