Hadoop Yarn:新MapReduce框架解析
39 浏览量
更新于2024-08-28
收藏 649KB PDF 举报
"Hadoop新MapReduce框架Yarn详解"
Hadoop MapReduce V2,也称为YARN(Yet Another Resource Negotiator),是Hadoop生态系统中针对原MapReduce框架的一次重大改进,旨在解决旧框架在大规模分布式计算环境中的性能瓶颈和扩展性问题。原MapReduce架构在处理大量作业和更大规模集群时暴露出了一些问题,如单点故障、资源管理效率低下以及任务调度不灵活等。
在旧的MapReduce框架中,JobTracker承担了双重职责:作业管理和资源调度。这导致了以下几个主要问题:
1. 单点故障:JobTracker是整个框架的核心,如果它发生故障,整个系统将受到影响,这是明显的单点故障问题。
2. 资源消耗过高:JobTracker既要监控和调度所有作业,还要处理心跳信息,当作业数量增加时,JobTracker的内存开销会急剧上升,增加了系统崩溃的风险。
3. 简单的资源模型:TaskTracker仅以map和reduce任务的数量来分配资源,忽略了CPU和内存的具体需求,可能导致资源分配不合理,甚至引发内存溢出(OOM)。
为了解决这些问题,YARN引入了全新的架构设计:
1. 分离资源管理和作业调度:YARN将JobTracker的功能拆分为两个独立的组件:ResourceManager(RM)和ApplicationMaster(AM)。ResourceManager负责全局资源管理,而ApplicationMaster专注于作业特定的调度和监控。
2. 分布式应用管理:每个作业都有自己的ApplicationMaster,与ResourceManager协商获取资源,然后监控和管理该作业的所有任务,这样避免了单点故障。
3. 动态资源分配:TaskTracker被替换为NodeManager,它们报告可用资源给ResourceManager,ResourceM
2021-10-02 上传
2019-08-06 上传
2022-11-26 上传
2023-11-05 上传
2023-09-03 上传
2023-09-08 上传
2023-06-29 上传
2024-08-28 上传
2024-07-24 上传
weixin_38692202
- 粉丝: 3
- 资源: 951
最新资源
- SSM动力电池数据管理系统源码及数据库详解
- R语言桑基图绘制与SCI图输入文件代码分析
- Linux下Sakagari Hurricane翻译工作:cpktools的使用教程
- prettybench: 让 Go 基准测试结果更易读
- Python官方文档查询库,提升开发效率与时间节约
- 基于Django的Python就业系统毕设源码
- 高并发下的SpringBoot与Nginx+Redis会话共享解决方案
- 构建问答游戏:Node.js与Express.js实战教程
- MATLAB在旅行商问题中的应用与优化方法研究
- OMAPL138 DSP平台UPP接口编程实践
- 杰克逊维尔非营利地基工程的VMS项目介绍
- 宠物猫企业网站模板PHP源码下载
- 52简易计算器源码解析与下载指南
- 探索Node.js v6.2.1 - 事件驱动的高性能Web服务器环境
- 找回WinSCP密码的神器:winscppasswd工具介绍
- xctools:解析Xcode命令行工具输出的Ruby库