spark shuffle中队列如何生成以及队列中的任务如何分配处理
时间: 2023-05-12 20:05:49 浏览: 74
SparkShuffle过程分析:Reduce阶段处理流程
在Spark Shuffle中,队列是由ShuffleMapTask生成的。ShuffleMapTask会将数据分区并写入磁盘,然后将分区信息发送给ReduceTask。ReduceTask会根据分区信息生成一个任务队列,并将任务分配给可用的Executor进行处理。任务分配的过程是根据ReduceTask的优先级和Executor的负载情况来进行的。一旦任务被分配给Executor,Executor就会从磁盘中读取数据并进行处理。
阅读全文