两台虚拟机上Linux Hadoop安装及集群配置教程

需积分: 9 150 浏览量更新于2024-09-10 收藏 113KB DOCX 举报

本文档详细介绍了如何在Linux环境下，尤其是在两台虚拟机CentOS 6.4-i386上安装和配置Hadoop 0.20.0集群。整个过程分为几个关键步骤： 1. **环境准备**： - 安装环境包括两台虚拟机，其中一台作为Master（192.168.112.3，即linux1），另一台作为Slave（192.168.112.4，即linux2）。确保两台机器之间的网络连接正常。 2. **hosts配置与SSH无密码登录**： - 在两台机器的`/etc/hosts`文件中添加对应主机名和IP地址，便于后续的通信。 - 在Master上执行SSH密钥对生成（id_rsa和id_rsa.pub），并将公钥复制到Slave的authorized_keys文件中，实现无密码SSH登录。 3. **安装JDK**： - 在两台服务器上安装Java Development Kit (JDK) 7u45，通过解压并配置环境变量`JAVA_HOME`指向安装目录。用户需自行调整环境变量路径。 4. **检查JDK安装**： - 使用`java –verbose`或`java –version`命令验证JDK是否正确安装。 5. **Hadoop安装与配置**： - 解压Hadoop-0.20.0.tar.gz文件到相应目录，并进入Hadoop的安装目录。 - 配置Hadoop的主要配置文件（通常在`hadoop-0.20.0/conf`目录下），这些配置可能包括核心配置（如core-site.xml, hdfs-site.xml, mapred-site.xml等）和其他必要的环境变量设置。 6. **配置Master节点**： - Master节点通常负责Hadoop的NameNode和JobTracker角色，需要额外配置，如启动守护进程、分配数据块等。 7. **配置Slave节点**： - Slave节点主要是DataNode和TaskTracker角色，配置时需要指定从Master节点获取任务和数据块信息。 8. **集群验证**： - 安装和配置完成后，通过运行Hadoop的相关命令（如`start-all.sh`或`hadoop-daemon.sh start namenode`等）来启动服务，并检查日志以确保集群配置无误。这篇文档提供了一个基础的步骤指南，帮助读者在Linux环境下搭建Hadoop 0.20.0集群，适用于初学者和需要在本地进行小规模测试的情况。随着Hadoop版本的更新，部分细节可能会有所变化，但基本原则保持一致。

Linux 下 hadoop 安装与配置

一、试验环境

两台虚拟机：CentOS—6.4-i386

Hadoop-0.20.0.tar.gz

jdk-7u45-linux-i586.tar.gz

二、安装

1、配置 hosts 与 ssh

首先我们拿虚拟机 linux1 做 master ，IP：192.168.112.3 以下简称

master

虚拟机 linux2 做 slave，slave1IP：192.168.112.4 以下简称 slave1

注：IP 根据自己实际情况修改

① 、分别在两台服务上修改 /etc/hosts 文件，在原文件中添加

192.168.112.3 linux1

192.168.112.4 linux2

127.0.0.1 localhost

② 、配置 ssh 无密码登陆

在 linux1 上设置无密码登陆，并把生成的 authorized_keys

下载后可阅读完整内容，剩余4页未读，立即下载

qq343526776

粉丝: 0

两台虚拟机上Linux Hadoop安装及集群配置教程

linux安装Hadoop

linux下的hadoop安装及配置详解

RedHatlinux下安装hadoop

Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04

Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04

hadoop在linux下的安装与使用_hadoop_in_linux.zip

Linux下Hadoop单机配置文档

Linux 系统下 Hadoop 安装配置教程.md

Linux下Hadoop配置

Linux下Hadoop分布式配置和使用

最新资源