hive实现聚合函数使用
时间: 2023-08-15 09:27:07 浏览: 108
hive函数应用
5星 · 资源好评率100%
Hive 支持多种聚合函数,如 COUNT、SUM、AVG、MAX、MIN 等。使用聚合函数可以对表中的数据进行统计和分析。
以下是使用 Hive 实现聚合函数的语法:
```
SELECT function(column_name)
FROM table_name
WHERE condition
GROUP BY column_name;
```
其中,function 是聚合函数名称,column_name 是要进行聚合操作的列名,table_name 是表名,condition 是筛选条件,GROUP BY 子句用于分组聚合。在 GROUP BY 子句中指定的列名将会根据相同的值进行分组,然后对每个分组应用聚合函数。
举个例子,如果我们要统计每个部门的员工人数和平均工资,可以使用以下语句:
```
SELECT department, COUNT(*) AS count, AVG(salary) AS avg_salary
FROM employee
GROUP BY department;
```
这里使用了 COUNT 和 AVG 两个聚合函数,分别统计了每个部门的员工人数和平均工资,并使用 AS 关键字对列名进行了重命名。
需要注意的是,在使用聚合函数时,除了使用 GROUP BY 子句进行分组聚合外,还可以使用 HAVING 子句进行筛选。HAVING 子句用于在分组后对分组进行筛选,只返回符合条件的分组。例如,如果我们只想返回员工人数大于等于 5 的部门信息,可以使用以下语句:
```
SELECT department, COUNT(*) AS count
FROM employee
GROUP BY department
HAVING count >= 5;
```
这里使用了 COUNT 聚合函数统计了每个部门的员工人数,并在 HAVING 子句中对 count 进行了筛选。
阅读全文