hive mapjoin
时间: 2023-02-15 10:57:20 浏览: 94
hive sql + left join 数据缺失
和 reduce side join的区别是什么?Hive的mapjoin和reduce side join之间的区别在于它们的实现方式。Mapjoin是一种在Map阶段完成的join,它只需要加载小表,然后在Map任务中进行join,因此它速度更快,但是需要保证小表数据量不会很大,否则会导致内存溢出。Reduce side join则是在Reduce阶段完成的join,它需要加载大表和小表,并在Reduce任务中进行join,因此它速度比较慢,但是不存在内存溢出的问题。
阅读全文