"Hadoop YARN源码解析:MR程序提交流程与节点运行过程分析"
本文主要是对Hadoop中YARN(Yet Another Resource Negotiator)源码的解析进行总结和概述。 YARN是Hadoop中用于资源管理和作业调度的框架,它负责管理和分配集群中的资源,并将作业调度到可用的计算资源上。在一次完整的作业提交过程中,涉及到多个组件和步骤,下面将对这些步骤进行概述。 作业提交首先是将作业程序提交到客户端所在的节点,然后由YarnRunner运行。接下来的步骤如下: 1. 创建一个Application,将其提交给ResourceManager(RM)。这个Application表示一个作业,由ResourceManager进行管理和调度。 2. 提交作业所需的资源给ResourceManager,包括计算资源和存储资源等。 3. 资源提交完毕后,申请运行MapReduce Application Master(MRAppMaster),该MRAppMaster将负责管理和调度作业的执行。 4. MRAppMaster将用户的请求初始化为一个Task,并开始领取Task任务。对于NodeManager来说,它需要进行两个操作:创建容器(Container)和将作业资源下载到本地。 5. MRAppMaster申请运行MapTask容器,由NodeManager创建容器并启动相应的程序脚本。 6. NodeManager向ResourceManager申请运行ReduceTask任务,并执行相应的NodeManager的ReduceTask任务。 7. ReduceTask从MapTask获取相应分区的输出数据。 8. 程序运行完成后,MRAppMaster会向ResourceManager注销自己。 以上就是整个作业提交和执行的大致流程。通过对源代码的分析,可以更加深入地了解其中的细节和实现原理。 需要注意的是,本文只是对YARN源码解析的概述和总结,具体的源码内容并没有提及。如果需要深入了解源码细节,建议查看相关的文档和源码。
剩余17页未读,继续阅读
- 粉丝: 1138
- 资源: 32
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- BSC关键绩效财务与客户指标详解
- 绘制企业战略地图:从财务到客户价值的六步法
- BSC关键绩效指标详解:财务与运营效率评估
- 手持移动数据终端:常见问题与WIFI设置指南
- 平衡计分卡(BSC):绩效管理与战略实施工具
- ESP8266智能家居控制系统设计与实现
- ESP8266在智能家居中的应用——网络家电控制系统
- BSC:平衡计分卡在绩效管理与信息技术中的应用
- 手持移动数据终端:常见问题与解决办法
- BSC模板:四大领域关键绩效指标详解(财务、客户、运营与成长)
- BSC:从绩效考核到计算机网络的关键概念
- BSC模板:四大维度关键绩效指标详解与预算达成分析
- 平衡计分卡(BSC):绩效考核与战略实施工具
- K-means聚类算法详解及其优缺点
- 平衡计分卡(BSC):从绩效考核到战略实施
- BSC:平衡计分卡与计算机网络中的应用