hivesql优化 子查询
时间: 2023-08-18 15:04:34 浏览: 181
hive查询优化
Hive SQL的优化问题中,对于子查询的优化可以采取以下几个方法。首先,数据过滤应尽早做,同时只选择所需要的列。这样可以减少不必要的数据读取和处理,提高查询效率。其次,可以同时进行生成a表的子查询和生成b表的子查询,通过设置hive.exec.parallel=true来实现并行执行多个有偏序关系的job,并通过hive.exec.parallel.thread.number参数来设置并行度,默认为8。这样可以充分利用资源,提高查询速度和资源的节约。[1][2][3]
阅读全文