hivesql的执行顺序
时间: 2023-11-02 20:05:56 浏览: 114
hive 面试宝典 spark hive优化
HiveSQL的执行顺序如下:
1. 首先,Hive会进行语法解析和语义分析,对查询语句进行验证和转换。
2. 然后,Hive会将查询语句转换成一系列的MapReduce任务或Tez任务。
3. 接下来,Hive会对查询语句进行优化,包括选择最优的执行计划、推测执行和动态分区剪枝等操作。
4. 在执行阶段,Hive会根据查询语句的不同部分,按照以下顺序执行:
- FROM子句:从数据源中获取数据。
- JOIN子句:根据连接条件将数据源中的数据进行连接。
- WHERE子句:对连接后的结果进行过滤。
- GROUP BY子句:根据指定的列对结果进行分组。
- HAVING子句:对分组后的结果进行过滤。
- SELECT子句:选择要查询的列。
- DISTINCT关键字:去除重复的行。
- ORDER BY子句:对结果按指定的列进行排序。
- LIMIT子句:限制结果的行数。
5. 最后,Hive会将查询的结果返回给用户。
阅读全文