awk '{if(NR>2)print}'
时间: 2024-04-25 12:26:29 浏览: 94
sed and awk 101 hacks.pdf
这段代码使用 awk 命令对数据进行处理,其中:
- `awk` 是一个用于文本处理的命令行工具,可以对数据进行分割、过滤、格式化等操作。
- `{if(NR>2)print}` 是一个 awk 脚本,表示对所有输入的行进行处理,只输出行号大于 2 的行。这是因为在执行 Hive 查询语句时,前两行会输出一些额外信息,不是真正的查询结果,因此需要通过 awk 过滤掉这些无用的行。
- `$data_size` 表示将处理后的结果赋值给变量 `data_size`。
综上所述,这段代码的作用是对 Hive 查询结果进行处理,仅输出真正的查询结果,并将结果保存到变量中,以便后续写入到 CSV 文件中。
阅读全文