uniq去重统计梳理
时间: 2024-08-15 21:10:27 浏览: 49
`uniq`是一个在Unix/Linux系统中常用的命令行工具,它用于去除文件中重复的行。当你需要查看并分析文本文件中独一无二的内容时,可以使用`uniq`。它可以:
1. **去重**:如果输入文件中有连续的重复行,`uniq`会只保留每组连续重复行中的第一行,其余的会被删除。
2. **计数**:默认情况下,`uniq`还会显示每个唯一行出现的次数。这通常配合`sort`一起使用,先排序再去除重复,最后统计。
例如,你可以运行 `uniq input.txt` 来查看并移除输入文件`input.txt`中的重复行,而 `uniq -c input.txt` 则会按行计数并列出结果。
如果你想要对每一列进行去重并计数,可以考虑使用其他的脚本语言如bash或者Python结合`awk`或者pandas等工具。
阅读全文