Hadoop 2.2.0 集群在 RHEL 6.2 下的安装实战

0 下载量 199 浏览量 更新于2024-08-28 收藏 396KB PDF 举报
Hadoop2.2.0集群在RHEL6.2下的安装实战 本文主要介绍了在RHEL6.2操作系统下安装Hadoop2.2.0集群的实践经验,包括安装Hadoop集群的步骤、遇到的问题和解决方法。 **Hadoop概述** Hadoop是一个基于Apache开源的分布式框架,包含MapReduce程序、HDFS文件系统等。Hadoop是由Lucene创始人Doug Cutting根据Google的相关内容山寨出来的分布式文件系统和对海量数据进行分析计算的基础框架系统。 **Hadoop集群搭建** 在RHEL6.2操作系统下,使用VMWare WorkStation虚拟了4个虚拟机,总计用10个小时的时间,完成虚拟机制作和Hadoop建立过程。 **遇到的问题和解决方法** 1. DataNode启动了,但是在NameNode中看不到。解决方法:检查/etc/hosts文件,删除多余的主机名映射,重新启动DataNode。 2. DataNode不启动,解决方法:删除/home/hadoop/dfs/data/current/VERSION文件。 3. 进入安全模式,不退出。解决方法:使用hdfs fsck命令检查文件系统,发现坏块比例较大,强制清理坏块,重启Hadoop。 **Hadoop相关概念** 1. HDFS(Hadoop Distributed File System):Hadoop的分布式文件系统。 2. NameNode:Hadoop HDFS元数据主节点服务器,负责保存DataNode文件存储元数据信息。 3. JobTracker:Hadoop的Map/Reduce作业跟踪器。 4. DataNode:Hadoop HDFS数据节点服务器,负责存储数据块。 **总结** 本文主要介绍了Hadoop2.2.0集群在RHEL6.2下的安装实践经验,包括安装步骤、遇到的问题和解决方法。同时,本文也对Hadoop的相关概念进行了介绍,包括HDFS、NameNode、JobTracker和DataNode等。