hive percentile函数的用法
时间: 2023-09-26 08:05:06 浏览: 266
hive函数应用
5星 · 资源好评率100%
Hive percentile函数用于计算某列数据的分位数。分位数是指将一组数据按大小顺序排列后,将其分成几等份,每一份的数据个数相等,所得到的数值就是分位数。
语法:
PERCENTILE(col, percentile)
参数说明:
- col:要计算分位数的列名或表达式。
- percentile:要计算的分位数,取值范围为0~1。
示例:
假设有以下数据:
| id | score |
| -- | ----- |
| 1 | 80 |
| 2 | 90 |
| 3 | 85 |
| 4 | 70 |
| 5 | 95 |
要计算分数列score的中位数(即50%分位数),可以使用以下Hive查询语句:
SELECT percentile(score, 0.5) AS median FROM scores;
运行结果:
| median |
| ------ |
| 85.0 |
这里的percentile函数的第二个参数为0.5,表示要计算的是50%分位数。函数返回的结果是85,即中位数。
阅读全文