CDH4.3.0版Hadoop-2.0.0安装全攻略

5星 · 超过95%的资源 需积分: 9 26 下载量 75 浏览量 更新于2024-07-24 收藏 135KB DOC 举报
"Hadoop-2.0.0-cdh4.3.0的安装手册提供了在特定环境下安装和配置Hadoop集群的详细步骤,由李昊龙于2013-08-07编写。该手册适用于那些希望在CDH4.3.0版本上部署Hadoop分布式文件系统(HDFS)和YARN资源管理器的用户。" 在安装Hadoop-2.0.0-cdh4.3.0之前,首先要进行环境准备。这一阶段包括以下步骤: 1. 主机:至少需要两台主机,例如namenode1和namenode2,它们分别分配有不同的IP地址和HOSTNAME,并且将承担不同的角色,如ResourceManager、NodeManager、NameNode、JournalNode和DataNode等。 2. 用户:通常,Hadoop的安装和运行是在一个特定的系统用户下进行的,比如hadoop用户,确保权限管理和安全性。 3. 程序包:下载并准备Hadoop相关的软件包,如Hadoop-2.0.0-cdh4.3.0的压缩文件。 4. hosts:在所有主机上更新hosts文件,将各主机的IP地址与主机名对应起来,以便于集群内的通信。 5. SSH互信:配置SSH无密码登录,实现节点间的安全通信,减少手动输入密码的麻烦。 6. 基础环境:确保所有主机都安装了必要的依赖软件,如Java运行环境(JRE或JDK),以及其他可能的库和工具。 接下来是程序的安装过程: 2.1 ZooKeeper:Zookeeper是Hadoop集群中的协调服务,它的安装步骤包括解压、修改配置文件zoo.cfg、创建myid文件、配置环境变量并进行测试,以确保其正常工作。 2.2 Hadoop:Hadoop的安装涉及多个配置文件的修改,包括: - 解压Hadoop压缩文件。 - 配置core-site.xml,设定Hadoop的基本配置,如名称节点和数据节点的位置。 - 配置hdfs-site.xml,定义HDFS的参数,如副本数量、块大小等。 - 配置mapred-site.xml,设置MapReduce框架的相关参数。 - 配置yarn-site.xml,配置YARN资源管理器。 - 配置slaves,列出所有数据节点的主机名。 - 配置journalnode.sh,对于HA NameNode设置JournalNode。 - 程序文件分发,将Hadoop的相关文件复制到集群的所有节点。 - 配置环境变量,使Hadoop命令在所有节点上可执行。 完成上述步骤后,就可以启动Hadoop服务了: 3.1 启动Zookeeper,这是Hadoop HA的前提。 3.2 启动HDFS,包括NameNode和DataNode,确保文件系统的可用性。 3.3 启动YARN,包括ResourceManager和NodeManager,以管理计算资源并运行应用程序。 这份手册详尽地介绍了在CDH4.3.0环境中安装和配置Hadoop的全过程,对于初次接触Hadoop或需要升级维护Hadoop集群的人来说是非常宝贵的参考资料。在实际操作中,遵循这些步骤可以避免很多常见问题,确保Hadoop集群的稳定运行。