CDH4 Hadoop-2.0.0与HBase-0.94.15 HA安装指南
5星 · 超过95%的资源 需积分: 9 184 浏览量
更新于2024-07-24
收藏 164KB DOC 举报
该文档是关于Hadoop-2.0.0-cdh4.3.0版本的高可用性(HA)安装指南,特别强调了HBase-0.94.15-cdh4.6.0的安装过程。这份手册由李昊龙在2013年和2014年进行更新,包含了从环境准备到程序安装,再到程序启动的详细步骤。
在环境准备部分,主要包括以下环节:
1. 主机配置:列举了四台主机的IP地址、HOSTNAME以及部署的模块,例如namenode1和namenode2作为NameNode和ResourceManager的角色,datanode1作为DataNode和JournalNode的角色。
2. 用户设置:虽然没有具体描述,但在安装Hadoop时通常需要一个非root用户来执行操作,例如hadoop或hdfs用户。
3. 程序包:提到了需要解压和安装的软件包,包括zookeeper、hadoop和hbase。
4. hosts配置:确保所有主机之间可以通过hostname互相访问,这对于集群通信至关重要。
5. SSH互信:在所有节点间建立无密码SSH登录,以简化远程命令执行。
6. 基础环境:可能包括Java环境的安装和其他系统级别的配置。
在程序安装阶段,主要步骤有:
1. ZooKeeper安装:包括解压、配置zoo.cfg、创建myid文件、配置环境变量以及进行基本的测试。
2. Hadoop安装:涉及解压、配置多个核心配置文件如core-site.xml(定义Hadoop的通用配置)、hdfs-site.xml(定义HDFS的配置)、mapred-site.xml(定义MapReduce框架配置)和yarn-site.xml(定义YARN配置),以及配置slaves文件(列出工作节点)、journalnode.sh脚本,最后分发程序文件并配置环境变量。
在程序启动环节:
1. 启动Zookeeper:这是Hadoop HA的前提,用于协调集群状态。
2. 启动HDFS:包括NameNode、JournalNode和DataNode,确保分布式文件系统的运行。
3. 启动YARN:启动ResourceManager、NodeManager等组件,以支持MapReduce任务的调度和执行。
该文档旨在指导用户如何在CDH4环境下搭建Hadoop和HBase的HA集群,以提供高可用性和容错性,确保数据的安全性和服务的连续性。安装过程中需要注意各个组件之间的依赖关系和配置一致性,以及正确配置HA的关键组件,如Zookeeper和NameNode的Failover Controller。此外,对于HBase的安装,还涉及到HMaster和HRegionServer的部署和配置。
361 浏览量
158 浏览量
134 浏览量
113 浏览量
171 浏览量
158 浏览量
liqiang70
- 粉丝: 1
- 资源: 16
最新资源
- Developmentment-school-template-:这是开发学校的静态网站
- 应用之间调用(iPhone源代码)
- Web Clipper Beta-crx插件
- FastDFS集群安装所需要的所有文件
- marklogic-workpapers:MarkLogic MEAN 堆栈应用程序
- Facebook登录页面复制
- simon:没有意义的游戏
- cp-database:编码海盗
- 易语言画心形画苹果形示爱程序-易语言
- scrcpy-win64-v1.14.zip
- Highcharts多个图表共用一个提示框,每个图表多条曲线
- Frosmo Preview-crx插件
- raxy:简单的状态管理器
- strudra:在Python中使用Ghidra结构
- GoStack-02Fundamentos-NodeJS-Desafio05:针对存储库模式的应用在NodeJS中的应用
- IP3_ALB