手动搭建Hadoop2.4集群：从零开始详解部署教程

需积分: 12 4 浏览量更新于2024-07-16 收藏 375KB DOCX 举报

本文档旨在为初学者提供一个全面的手动搭建Hadoop 2.4集群的详细教程，帮助他们深入理解大数据集群的基础架构。通过这个过程，读者将能够亲自实践HDFS（Hadoop Distributed File System）的部署和配置，以及掌握Hadoop的核心组件——Hadoop MapReduce、HBase等的安装和设置。首先，从环境准备开始。文档强调了硬件和软件环境的重要性，建议使用32GB内存和Intel Xeon 2.00GHz四核24线程的处理器，操作系统选择Oracle Enterprise Linux 6.6或Red Hat Enterprise Linux Server 6.6，文件系统则推荐使用Ext4。在软件方面，重点是安装Java Development Kit (JDK)，这里选择了7u76版本的绿色解压缩版，解压后需要配置环境变量，确保JAVA_HOME、JAVA_BIN和CLASSPATH路径正确，以便后续Hadoop组件的运行。接下来，进入CDH（Cloudera Distribution for Hadoop）的安装部分。首先，需要修改主机名，包括编辑/etc/sysconfig/network文件，设置HOSTNAME和相关的网络配置。此外，还需更新/etc/hosts文件，并确保所有节点之间的网络通信畅通，通过SSH服务的设置来实现。在SSH配置中，生成公钥对并将其添加到authorized_keys中，以实现无密码登录，同时通过scp命令在各个节点间复制SSH密钥。在实际操作过程中，master节点和datanode节点的步骤略有不同，但都涉及到了基础的网络配置和SSH权限管理。通过这些步骤，用户不仅能够学会如何手动部署Hadoop集群，还能了解到集群中的角色分工和通信机制，这对于理解和掌握大数据处理流程至关重要。这篇文档为初学者提供了一个详尽的Hadoop集群搭建指南，涵盖了从硬件选择、操作系统配置、JDK安装、CDH安装、网络设置到SSH通信的全方位教程，有助于培养实践能力，提升对大数据处理平台的认识。

Hadoop 集群部署

功就会看到登陆页面。

8) 安装 CDH5 先下载到本

地 http://archive-primary.cloudera.com/cdh5/parcels/5.0.0/，这里需

要下载两样东西，首先是与自己系统版本相对应的 parcel 包，然后是

manifest.json 文件。下载完成后将这两个文件放到 master 节点的 /opt/

cloudera/parcel-repo 下（目录在安装 Cloudera Manager 5 时已经生成），注

意目录一个字都不能错，接下来打开 manifest.json 文件，里面是 json 格式的配置，

我们需要的就是与我们系统版本相对应的 hash 码，因为我们用的是 Centos6.5，所以

找到如下位置：

无标题

在这个大括号的最下面找到“hash”所对应的值。

无标题 1

将“hash”的值复制下来，然后创建一个文件，文件名与你的 parel 包名一致，并

加上.sha 后缀：

无标题 2

这样你的目录下将有这 3 个文件，将“hash”的值复制到新建的 sha 文件中，并保存，

好了，我们的本地源制作完成了。这样基本大功告成了，再之后的操作就是控制台按照

步骤安装即可。

打开 http://192.168.1.101:7180 ，登陆控制台，默认账户和密码都是

admin，安装时选择免费版，之后由于 cm5 对中文的支持很强大，按照提示安装即可，

如果系统配置有什么问题在安装过程中会有提示，根据提示给系统安装组件就可以了。

9) 如果在安装时选择了安装 Hive，可能会遇到安装失败的问题，查看一下日志发

现时安装 Hive 时需要安装 JDBC 驱动，所以同样我们将 Mysql 的驱动包拷贝到 /

opt/cloudera/parcels/CDH-5.0.0-1.cdh5.0.0.p0.47/lib/hive/lib/ 目

录下，之后再继续安装就不会遇到问题了。

1.1.2.5. yum 遇到的问题解决

rm -f /var/run/yum.pid #杀死 yum 进程

yum clean all

yum makecache

参考部署：http://my.oschina.net/voyage1314/blog/262392

http://www.it165.net/os/html/201408/9104.html

第 8 页共 41 页

剩余40页未读，继续阅读

柒嘴八舌

粉丝: 279
资源: 6

手动搭建Hadoop2.4集群：从零开始详解部署教程

大数据教程之搭建Hadoop集群.zip_大数据环境搭建hadoop

基于centos的大数据hadoop集群搭建说明文档

基于windows的hadoop集群搭建图文教程 自己写的亲测可以安装

最详细的Hadoop环境搭建

大数据环境一键安装脚本.zip

CDH5.9安装新手指导文档

CDH5环境下Hadoop集群动态部署与管理实践

Apache Kylin手动搭建与入门教程：配置与实践

CentOS7快速部署Hadoop单节点伪分布式教程

【Hadoop伪分布式模式】：本地测试到集群仿真的无缝对接指南

最新资源

基于windows的hadoop集群搭建图文教程自己写的亲测可以安装