Hadoop 2.2.0 完全分布式集群平台安装与配置
5星 · 超过95%的资源 需积分: 9 187 浏览量
更新于2024-07-24
1
收藏 881KB DOCX 举报
Hadoop2.2.0集群安装
Hadoop2.2.0完全分布式集群平台安装设置是一个复杂的过程,需要多个步骤和配置。这里我们将详细介绍Hadoop2.2.0的集群安装过程,包括HDFS HA架构、QJM的安装和配置、Hadoop的环境变量配置、Native包编译、Hadoop配置文件修改、防火墙关闭等。
一、HDFS HA架构
HDFS HA架构是Hadoop2.2.0完全分布式集群平台的核心组件之一。它由两个NameNode组成,一个处于active状态,另一个处于standby状态。ActiveNameNode对外提供服务,比如处理来自客户端的RPC请求,而StandbyNameNode则不对外提供服务,仅同步activenamenode的状态,以便能够在它失败时快速进行切换。
为了能够实时同步Active和Standby两个NameNode的元数据信息(实际上editlog),需提供一个共享存储系统,可以是NFS、QJM(QuorumJournalManager)或者Bookeeper,ActiveNamenode将数据写入共享存储系统,而Standby监听该系统,一旦发现有新数据写入,则读取这些数据,并加载到自己内存中,以保证自己内存状态与ActiveNameNode保持基本一致,如此这般,在紧急情况下standby便可快速切为activenamenode。
二、QJM的安装和配置
QJM是Hadoop2.2.0中的一个重要组件,用于提供共享存储系统,以便实现HDFS HA架构。在QJM中,主备NameNode之间通过一组JournalNode同步元数据信息,一条数据只要成功写入多数JournalNode即认为写入成功。通常配置奇数个(2N+1)个JournalNode,这样,只要N+1个写入成功就认为数据写入成功,此时最多容忍N-1个JournalNode挂掉。
三、Hadoop的环境变量配置
在安装Hadoop之前,需要先配置好环境变量。包括设置JAVA_HOME、HADOOP_HOME等环境变量,以便Hadoop可以正确地运行。
四、Native包编译
在安装Hadoop之前,需要编译Hadoop Native包。 Native包是Hadoop的一个重要组件,用于提供底层文件系统的支持。编译Native包需要依赖环境配置和编译环境准备等多个步骤。
五、Hadoop配置文件修改
在安装Hadoop之后,需要修改Hadoop的配置文件,以便Hadoop可以正确地运行。包括修改core-site.xml、hdfs-site.xml、mapred-site.xml等配置文件。
六、防火墙关闭
在安装Hadoop之前,需要关闭防火墙,以便Hadoop可以正确地运行。
七、Hadoop的安装
在所有的前提条件都ready之后,我们可以开始安装Hadoop了。包括下载解压hadoop-2.2.0.tar.gz、配置Hadoop的环境变量、编译Hadoop Native包、修改Hadoop的配置文件等多个步骤。
八、Hadoop的运行
在安装Hadoop之后,我们可以开始运行Hadoop了。包括启动Hadoop、查看Hadoop的日志、关闭Hadoop等多个步骤。
Hadoop2.2.0完全分布式集群平台安装设置是一个复杂的过程,需要多个步骤和配置。但是,通过本文的介绍,我们可以更好地理解Hadoop2.2.0的安装过程,并更好地使用Hadoop来实现我们的数据分析和处理需求。
点击了解资源详情
点击了解资源详情
点击了解资源详情
2015-06-16 上传
2021-01-30 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
雲竹小师傅
- 粉丝: 0
- 资源: 1
最新资源
- java书籍-java code conventions
- 高质量C编程指南-林锐博士
- java api 帮助文档 chm 1.5 1.6 中文版英文版下载地址.
- ftp_scoket源码
- vi编辑器常用的命令及快捷键
- 经典PC汇编教程.pdf
- Oracle 9i10g编程艺术
- 哈弗曼编码 c 数据结构
- 计算机英文文献加翻译
- 单片机ADDA实验 MCS-51单片机原理
- 交通控制信号电路图用途广泛
- windows2003配置
- 2008软件评测师上午
- 成为Linux的主人
- Windows CE下操作GPIO的方法.pdf
- 70-536 中文([1].NET Framework2.0程序设计)认证题库