Hadoop 2.6.0高可用集群搭建指南:QJM与YARN双主备详解
需积分: 9 168 浏览量
更新于2024-07-08
收藏 1.13MB DOCX 举报
本文档主要介绍了如何在Hadoop环境中实现完全分布式HA(High Availability)配置,以便提高系统的可靠性和容错能力。首先,我们回顾了Hadoop 2.0中关于HDFS和YARN组件的高可用性解决方案:
1. **HDFS HA**:
- HDFS采用的是Active-Active模式,通常由两个NameNode节点组成,一个为主节点(Active NameNode)负责对外服务,另一个为备节点(Standby NameNode)负责镜像主节点的状态并保持同步。Hadoop 2.0的HDFS HA支持两种方式,如NFS和QJM,这里选择了QJM方法,通过JournalNode确保数据一致性,至少三个JournalNode保证数据写入的持久化,并利用Zookeeper进行故障转移管理。
2. **YARN HA**:
- YARN的ResourceManager也有HA版本,两个RM(ResourceManager)分别处于Active和Standby状态,Zookeeper负责协调状态转换,确保资源管理的高可用。
3. **必备软件与环境**:
- 配置环境包括:
- 操作系统:CentOS 7或Windows 10(通过VirtualBox)
- JDK:Java Development Kit 1.8.131
- Hadoop:Hadoop-2.6.0-cdh5.7.0,版本选择较旧是为了兼容性考虑
- Zookeeper:zookeeper-3.4.5-cdh5.7.0
- 远程连接工具:XShell 6
- SFTP工具:FileZilla 3.33.0
4. **目标**:
- 实现HAHadoop高可用集群的搭建,基于已有的完全分布式Hadoop基础配置,并且强调在搭建前删除/opt/hdfs/tmp目录下的所有文件以防止名称节点无法热备份,同时推荐安装特定插件以提升系统的稳定性。
5. **操作步骤**:
- 集群规划:设计一个由3台主机组成的集群,这将用于搭建HAHadoop集群。
- 注意事项:在整个过程中,要确保遵循先删除临时文件的原则,并根据文档指导安装相关插件,尤其是在Master节点和Slave节点上。
本文档提供了详细的步骤指导,涵盖了从HDFS到YARN的高可用性配置,以及所需软件的版本选择,对于理解和搭建Hadoop集群的高可用性架构具有很高的实用价值。
2021-10-05 上传
2020-06-28 上传
2020-09-01 上传
2020-01-16 上传
2019-11-26 上传
2024-05-23 上传
2022-01-04 上传
2021-05-24 上传
2021-06-03 上传
㫪旧
- 粉丝: 20
- 资源: 5
最新资源
- 前端协作项目:发布猜图游戏功能与待修复事项
- Spring框架REST服务开发实践指南
- ALU课设实现基础与高级运算功能
- 深入了解STK:C++音频信号处理综合工具套件
- 华中科技大学电信学院软件无线电实验资料汇总
- CGSN数据解析与集成验证工具集:Python和Shell脚本
- Java实现的远程视频会议系统开发教程
- Change-OEM: 用Java修改Windows OEM信息与Logo
- cmnd:文本到远程API的桥接平台开发
- 解决BIOS刷写错误28:PRR.exe的应用与效果
- 深度学习对抗攻击库:adversarial_robustness_toolbox 1.10.0
- Win7系统CP2102驱动下载与安装指南
- 深入理解Java中的函数式编程技巧
- GY-906 MLX90614ESF传感器模块温度采集应用资料
- Adversarial Robustness Toolbox 1.15.1 工具包安装教程
- GNU Radio的供应商中立SDR开发包:gr-sdr介绍