Hadoop 2.6.0高可用集群搭建指南:QJM与YARN双主备详解
需积分: 9 96 浏览量
更新于2024-07-08
收藏 1.13MB DOCX 举报
本文档主要介绍了如何在Hadoop环境中实现完全分布式HA(High Availability)配置,以便提高系统的可靠性和容错能力。首先,我们回顾了Hadoop 2.0中关于HDFS和YARN组件的高可用性解决方案:
1. **HDFS HA**:
- HDFS采用的是Active-Active模式,通常由两个NameNode节点组成,一个为主节点(Active NameNode)负责对外服务,另一个为备节点(Standby NameNode)负责镜像主节点的状态并保持同步。Hadoop 2.0的HDFS HA支持两种方式,如NFS和QJM,这里选择了QJM方法,通过JournalNode确保数据一致性,至少三个JournalNode保证数据写入的持久化,并利用Zookeeper进行故障转移管理。
2. **YARN HA**:
- YARN的ResourceManager也有HA版本,两个RM(ResourceManager)分别处于Active和Standby状态,Zookeeper负责协调状态转换,确保资源管理的高可用。
3. **必备软件与环境**:
- 配置环境包括:
- 操作系统:CentOS 7或Windows 10(通过VirtualBox)
- JDK:Java Development Kit 1.8.131
- Hadoop:Hadoop-2.6.0-cdh5.7.0,版本选择较旧是为了兼容性考虑
- Zookeeper:zookeeper-3.4.5-cdh5.7.0
- 远程连接工具:XShell 6
- SFTP工具:FileZilla 3.33.0
4. **目标**:
- 实现HAHadoop高可用集群的搭建,基于已有的完全分布式Hadoop基础配置,并且强调在搭建前删除/opt/hdfs/tmp目录下的所有文件以防止名称节点无法热备份,同时推荐安装特定插件以提升系统的稳定性。
5. **操作步骤**:
- 集群规划:设计一个由3台主机组成的集群,这将用于搭建HAHadoop集群。
- 注意事项:在整个过程中,要确保遵循先删除临时文件的原则,并根据文档指导安装相关插件,尤其是在Master节点和Slave节点上。
本文档提供了详细的步骤指导,涵盖了从HDFS到YARN的高可用性配置,以及所需软件的版本选择,对于理解和搭建Hadoop集群的高可用性架构具有很高的实用价值。
2021-10-05 上传
2020-09-01 上传
2019-09-26 上传
2020-01-16 上传
2019-11-26 上传
2024-05-23 上传
2022-01-04 上传
2020-10-10 上传
㫪旧
- 粉丝: 20
- 资源: 5
最新资源
- Sumo_Asteroids:我不知道我在做什么
- kafka-consumer-manager:适用于kafka消费者的包装器,支持健康检查,重试和偏移差异报告
- djangosimple:从初学者到高级使用django的项目
- ANNOgesic-1.0.17-py3-none-any.whl.zip
- Home1:1个
- refocus-collector
- ats-ebp-validator:符合 CableLabs ATS 和 EBP 规范的传输流验证软件
- Python库 | msgpack_rlp-0.6.1-cp27-cp27mu-manylinux1_i686.whl
- torch_sparse-0.6.12-cp37-cp37m-win_amd64whl.zip
- 迪马股份迪马股份2020年年度报告.rar
- TreeCracker:基于树的Minecraft种子饼干(MSCT)
- LitDatabase:C ++中的一个简单数据库
- cordova-smartlook:适用于Cordova Android的官方Smartlook SDK插件
- classic-arcade-game-clone
- doshemee:使用C ++和SMFL进行游戏编程的教程
- GuessNumGame