Ubuntu上快速搭建Hadoop 2.6.4集群教程

需积分: 28 73 浏览量更新于2024-07-18 收藏 865KB PDF 举报

本文档详细介绍了如何在Ubuntu系统上配置一个分布式Hadoop集群，主要针对单台电脑环境，利用虚拟化工具如Vmware Workstation 12来创建四个虚拟机作为集群节点。以下是关键步骤的详细解释： 1. **准备工作**： - 硬件要求：建议主机电脑配置至少4核CPU，8GB内存，以及200GB硬盘，以确保足够的资源供虚拟机运行。 - 软件准备：你需要Vmware Workstation 12作为虚拟化工具，Ubuntu 16.04.3 LTS作为操作系统镜像，JDK 1.7.0_80用于Java开发环境，以及Hadoop 2.6.4版本用于分布式计算。 2. **创建虚拟机**： - 在主机上安装Vmware Workstation，然后创建一个新的虚拟机，命名为"master"，设置所需的CPU、内存和硬盘资源。 - 安装Ubuntu：将iso镜像挂载到虚拟机，按照引导进行安装，指定用户"raymond"和密码"123456"，并非root权限。 3. **配置静态IP**： - 登录master虚拟机，通过`ifconfig`命令检查网络接口，通常名为ens33。 - 打开`/etc/network/interfaces`配置文件，将ens33设为静态IP，分配给192.168.128.100，子网掩码255.255.255.0，网关设置为192.168.128.2。 4. **创建从节点**： - 对于slave1至slave3，重复上述步骤，分别创建虚拟机，设置为从节点，分配不同的IP地址，如192.168.128.101、192.168.128.102和192.168.128.103，但只配置静态IP，其他操作保持一致。 5. **安装Hadoop**： - 在master节点上安装Hadoop，解压下载的hadoop-2.6.4.tar.gz，配置环境变量，确保Hadoop可执行文件路径在系统的PATH中。 - 配置Hadoop的核心配置文件（如core-site.xml、hdfs-site.xml和mapred-site.xml），以及Hadoop Distributed File System (HDFS) 和 MapReduce 的相关配置。 - 启动Hadoop服务，包括HDFS namenode、datanode和ResourceManager，JobTracker。 6. **验证集群**： - 使用命令行工具如`hadoop dfs`来测试HDFS的可用性，`jps`检查各个Hadoop进程是否正在运行。 - 验证MapReduce任务可以在从节点上执行，如运行一个简单的WordCount示例。在整个过程中，文档强调了每个步骤的重要性，特别是网络配置和权限设置，因为它们直接影响到集群的连通性和安全性。通过这些详细步骤，即使是没有经验的用户也能在Ubuntu环境中成功搭建Hadoop集群。

6.2.2 创建用户 hduser

输入命令：

sudo useradd -s /bin/bash -d /home/hduser -m hduser -g hadoop

6.2.3 创建 hduser 的密码

输入命令：

sudo passwd hduser

6.2.4 以用户 hduser 登录系统

输入命令：

su - hduser

或 su hduser

6.3 在 master 节点，生成 ssh 访问证书

输入命令：

ssh-keygen -t rsa

接着按三次 Enter 键(不需要输入内容)

6.4 在 master 节点，导入 ssh 证书

输入命令：

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

测试 ssh 无密码访问 master, 输入命令：

ssh master

如果未提示输入密码，直接登录，则表明设置成功。

6.5 在各 slave 节点上，导入 master 上的 ssh 证书。

输入命令：

su - hduser

scp hduser@master:~/.ssh/id_rsa.pub ~/.ssh/key.pub

cat ~/.ssh/key.pub >> ~/.ssh/authorized_keys

在 master 上进行测试，输入命令：

ssh slave2

如果未提示输入密码，直接登录，则表明设置成功。

7. 时间同步设置

在 master 节点上配置时间服务器（ntpd）, 各 slave 节点向它进行时间同步，最终保证

各节点时间一致。

7.1 安装 ntp 组件(在每个节点执行）

sudo apt-get install ntp

sudo apt-get install ntpdate

7.2 配置 ntp server(在主节点 master 执行）

编辑配置文件 ntp.conf，输入命令：

sudo nano /etc/ntp.conf

以#注释掉 server 开头的行，并添加以下内容：

restrict 192.168.128.0 mask 255.255.255.0 nomodify notrap

server ntp.ubuntu.com prefer

剩余15页未读，继续阅读

abc_321a

粉丝: 11
资源: 3

Ubuntu上快速搭建Hadoop 2.6.4集群教程

ubuntu搭建hadoop

基于ubuntu安装Hadoop详细过程

ubuntu下搭建hadoop

ubuntu20.04配置hadoop集群

ubuntu下安装hadoop集群

两台 Ubuntu 机器实现 Hadoop 集群

ubuntu docker搭建Hadoop集群环境的方法

Ubuntu上搭建Hadoop集群详解

Ubuntu上搭建Hadoop集群详细步骤

Ubuntu上配置Cloudera Hadoop集群指南

最新资源