深入解析：Hadoop MapReduce 传统与YARN机制

1星需积分: 12 71 浏览量更新于2024-09-10 收藏 449KB PDF 举报

"深入解析Hadoop MapReduce原理，包括传统MapReduce和基于YARN的MapReduce的体系结构、工作流程及故障处理" MapReduce是Hadoop生态中的核心组件，主要用于处理和存储大规模数据集。它通过分布式计算模型，将大数据任务分解成可管理的小任务，在多台机器上并行处理，从而提高了数据处理效率。 ### 1. 传统MapReduce #### 系统架构传统MapReduce架构基于主从模型，主要包括JobTracker和TaskTracker两个关键角色： - **JobTracker**：作为主节点，它是整个MapReduce框架的控制中心。JobTracker负责作业的提交、任务调度、状态监控和故障恢复。它将大的作业拆分成Map任务和Reduce任务，并将这些任务分配给TaskTracker执行。JobTracker监听8021端口，通过RPC协议与客户端和TaskTracker通信。 - **TaskTracker**：运行在从节点上，负责接收和执行JobTracker分配的任务。每个TaskTracker可以同时运行多个Child JVM实例，每个实例处理一个Map或Reduce任务。TaskTracker通过50060端口对外提供HTTP服务，用于展示任务执行状态。 - **Child JVM**：在TaskTracker节点上运行，实际执行Map和Reduce任务的Java虚拟机。 - **Client**：用户程序所在的节点，负责作业的提交和结果的获取。 - **HDFS**：提供数据存储，JobTracker和TaskTracker之间通过HDFS共享作业相关的文件。 #### 工作流程 1. 客户端提交作业到JobTracker，JobTracker将作业分解为Map任务和Reduce任务。 2. JobTracker根据数据本地性原则，将任务分配给最接近数据块的TaskTracker执行。 3. TaskTracker启动Child JVM来执行Map任务，读取数据，进行映射操作。 4. Map任务的结果（键值对）被分区和排序，然后传输到Reduce任务。 5. Reduce任务接收来自多个Map任务的数据，进行归约操作，最后生成最终结果。 ### 2. 基于YARN的MapReduce Hadoop 0.23.0引入YARN（Yet Another Resource Negotiator），目的是分离资源管理和应用程序管理，解决传统MapReduce中的单点故障和资源利用率低的问题。在YARN中，JobTracker的角色被拆分为ResourceManager和ApplicationMaster两个部分： - **ResourceManager (RM)**：全局资源调度器，负责集群资源的管理和分配。 - **ApplicationMaster (AM)**：每个MapReduce作业都有一个AM，负责作业的生命周期管理和任务调度。 TaskTracker被替换为NodeManager，负责管理节点上的容器（Container），这些容器执行由AM分配的任务。工作流程基本保持不变，但调度和资源管理由YARN统一处理，提高了系统的灵活性和资源利用率。 ### 故障处理在传统MapReduce中，JobTracker负责故障检测和恢复，当TaskTracker故障时，JobTracker会重新调度任务。而在YARN中，ResourceManager监控NodeManager，如果NodeManager故障，ResourceManager会重新启动任务。 ### 总结 MapReduce的核心在于其分布式计算模型，通过将大任务拆分，实现了对大规模数据的高效处理。而YARN的引入，使得资源管理更加灵活，提高了集群的整体性能。理解这两种模式的原理，对于优化Hadoop集群的性能和可靠性至关重要。

队列中获取远程调用并对其进行初始化。初始化涉及到创建一个代表即将执行作业的对象，

该对象封装了作业的任务和用于跟踪任务状态和作业进度的登记信息。作业调度器首先从

HDFS 提取 client 计算出的输入分片数，然后针对每个分片创建一个 map 任务。Reduce 任务

的数量由作业的 mapred.reduce.tasks 属性确定，该属性的值通过 setNumReduceTasks 方法来

设定。调度器仅仅简单的创建这个数量的 reduce 任务，此时任务会被分配 ID。除了创建 map

和 reduce 任务外，还需要创建另外两个任务，作业 setup 任务和作业 cleanup 任务。这两个

任务由 TaskTracker 运行，前者用于在任何 map 任务执行前对作业进行配置，后者在所有的

reduce 任务执行完后做清除工作。作业所配置的 OutputCommiter 决定了要执行的代码（缺

省为 FileOutputCommiter）。作业 setup 任务负责创建作业最终的输出目录和任务输出的临时

工作空间，作业 cleanup 任务将删除任务输出的临时工作空间。注意此处创建的是任务对象，

实际执行的任务在 tasktracker 所在节点。

阶段三：任务分配

TaskTracker 在一个简单的循环中周期性的发送心跳调用给 jobracker，心跳告诉 jobtracker，

本 tasktracker 是存活状态，除此外心跳还告诉 jobtracker 是否可以运行一个新任务，如果是，

jobtracker 通过心跳的应答让 tasktracker 分配一个任务。

Jobtracker 需要先选择一个作业，然后再为 tasktracker 选择一个任务。Jobtracker 缺省维

护了一个作业优先级队列，选择了一个作业后，jobtracker 为该作业选择任务。

Tasktracker 对于 map 和 reduce 任务有固定数量的槽位，比如：一个 tasktracker 可以同

时运行两个 map 任务、两个 reduce 任务。缺省的调度策略优先满足 map 任务要求。比如如

果只有一个任务插槽，jobtracker 将选择一个 map 任务。

在选择 reduce 任务时，jobtracker 仅仅从 yet-to-be-run reduce 任务列表中取下一个，因

为不需要考虑数据的本地化问题。对于 map 任务，需要考虑 tasktracker 的网络位置，并选

择输入分片离其最近的 tasktracker。优化的条件下，任务是数据本地化的，也就是说与数据

分片在同一个节点上。任务也可以使机架本地化，任务与数据在同一个机架上，但不在一个

节点上。当然也可以位于不同的机架上。

阶段四：任务执行

既然 tasktracker 被分配了任务，接下来就是要运行任务。首先 tasktracker 从 HDFS 中拷

贝 MapReduce 作业的 JAR 到自己的文件系统，同时也从分布式缓存中拷贝任何需要的文件

到本地磁盘，然后为任务创建一个本地目录，并且在该本地目录解开 JAR 包，最后创建一个

TaskRunner 实例去运行任务。

TaskRunner 为每个任务都启动一个虚拟机 child JVM，从而使用户代码中的 BUG 不会影

响 tasktracker，当然也可以在任务之间重用虚拟机。

运行任务的子进程通过“脐带”接口与 tasktracker 通信，子进程每隔几秒向 tasktracker

通告执行进展直至任务完成。每个任务还要执行 setup 和 cleanup 操作，具体操作由作业的

OutputCommiter 决定。cleanup 用来提交任务，具体对于基于文件的 MapReduce 作业来说，

就是把该任务的输入写入到其最终的位置。提交协议保证不会出现重复提交（当启用投机执

行时）。

阶段五：状态更新

MapReduce 作业是长时间批处理的作业，执行时间从几分钟到几个小时都有可能，故

而在执行过程中需要给用户反馈执行进展。一个作业及其任务都有一个状态，该状态包括任

务当前状态（running,failed,successfully）、 map 和 reduce 的进展、计数器的值和状态信息（用

户可编码写入），这些信息如何反馈给客户？

一个任务执行过程中，任务会跟踪处理进展（任务完成百分比），对于 map 任务来说，

就是被处理的输入的比例，对于 reduce 任务稍微有些复杂，但系统仍能给出 reduce 完成的

剩余11页未读，继续阅读

zhangbaolin

粉丝: 114

深入解析：Hadoop MapReduce 传统与YARN机制

Hadoop MapReduce原理与实战：从WordCount到TopN

深入解析Hadoop MapReduce原理与实践

Hadoop MapReduce客户端应用API文档中英对照版

Hadoop MapReduce工作原理详解

Hadoop MapReduce

hadoop mapreduce

mapred.zip_hadoop_hadoop mapreduce_mapReduce

Hadoop MapReduce Cookbook

hadoop MapReduce教材

hadoop mapreduce2

最新资源