Linux CentOS下Hadoop伪分布式安装全攻略

需积分: 20 163 浏览量更新于2024-09-12 收藏 342KB PDF 举报

"LinuxCentOS下Hadoop伪分布模式安装笔记" 在本文档中，我们将深入探讨如何在Linux CentOS系统上安装Hadoop的伪分布式模式。Hadoop是一个开源的分布式计算框架，它允许处理和存储大量数据。在伪分布式模式下，Hadoop的所有组件都在同一台机器上运行，但模拟了分布式环境的行为，这对于开发和测试环境非常有用。首先，安装Hadoop前，我们需要确保系统已安装Java Development Kit (JDK)。在这个案例中，使用的版本是jdk1.6.0_20。JDK是运行Hadoop所必需的，因为Hadoop是用Java编写的，并且依赖于Java运行时环境。接下来，我们需要下载Hadoop的二进制包，这里使用的是hadoop-0.20.2.tar.gz。解压缩这个包到一个适当的目录，比如/usr/local/或个人的home目录。解压后，需要配置Hadoop的环境变量，包括HADOOP_HOME、JAVA_HOME等，确保Hadoop能找到Java并正确运行。在进行Hadoop的安装之前，还需要配置SSH无密码登录。这是因为Hadoop的守护进程之间需要通过SSH进行通信。使用root用户运行`ssh-keygen -t rsa`命令生成SSH密钥对。默认情况下，公钥会被保存在`~/.ssh/id_rsa.pub`，私钥保存在`~/.ssh/id_rsa`。接着，将公钥追加到`~/.ssh/authorized_keys`文件，以便SSH可以无密码地连接到本地主机。完成SSH配置后，我们需要修改Hadoop的配置文件。主要涉及两个文件：`conf/hadoop-env.sh`和`conf/core-site.xml`。在`hadoop-env.sh`中设置JAVA_HOME为JDK的安装路径。在`core-site.xml`中，配置`fs.defaultFS`属性，指定HDFS的默认名称节点，通常设置为`hdfs://localhost:9000`。接下来，配置Hadoop的主配置文件`hdfs-site.xml`，设置`dfs.replication`为1，因为我们在伪分布式模式下只有一个节点。另外，还需要配置`mapred-site.xml`，将`mapreduce.framework.name`设为`local`，表示使用本地运行模式。至此，所有的配置工作已完成，可以启动Hadoop了。先格式化NameNode，然后启动DataNode和NameNode，以及其他的Hadoop服务。格式化NameNode的命令是`hdfs namenode -format`，启动服务则可以通过`start-dfs.sh`和`start-yarn.sh`脚本。在运行过程中，可能会遇到各种问题，例如端口冲突、权限问题或者配置错误等。解决这些问题通常需要查看日志文件，并根据错误信息进行调试。安装完成后，可以通过Hadoop的命令行工具来测试Hadoop是否正常工作，如`hadoop fs -ls /`检查根目录下的文件。虽然Hadoop的伪分布式安装相对简单，但每个步骤都需要细心操作，尤其是在配置阶段。正确理解和配置Hadoop的环境变量、SSH无密码登录以及核心配置文件是安装成功的关键。遇到问题时，保持耐心，查阅官方文档和社区资源，通常都能找到解决方案。

Linux CentOS 下 Hadoop 伪分布模式安装笔记

一. 概要

经过几天的调试，终于在 Linux Cent OS 5.0 下成功搭建 Hadoop 测试环境。

本次测试在一台服务器上进行伪分布式搭建。Hadoop 伪分布式模式是在单机上

模拟 Hadoop 分布式，单机上的分布式并不是真正的伪分布式，而是使用线程

模拟分布式。Hadoop 本身是无法区分伪分布式和分布式的，两种配置也很相似，

唯一不同的地方是伪分布式是在单机器上配置，数据节点和名字节点均是一个机

器。虽然 Hadoop 的安装步骤并不复杂，但是我在安装期间还是遇到了很多琐碎

的问题，现将自己搭建 Hadoop 的详细过程和遇到的问题记录下来。

二. 环境搭建

搭建测试环境所需的软件包括：jdk1.6.0_20、hadoop-0.20.2.tar.gz。测试

服务器操作系统 Linux Cent OS 5.0。

1. SSH 无密码验证配置

Hadoop 需要使用 SSH 协议，namenode 将使用 SSH 协议启动

namenode 和 datanode 进程，伪分布式模式数据节点和名称节点均是本身，必

须配置 SSH localhost 无密码验证。

用 root 用户登录，在家目录下执行如下命令：ssh-keygen -t rsa

[root@master ~]# ssh-keygen -t rsa

Generating public/private rsa key pair.

Enter file in which to save the key (/root/.ssh/id_rsa): & 按回车默认路径 &

Created directory '/root/.ssh'. &创建/root/.ssh 目录&

Enter passphrase (empty for no passphrase):

Enter same passphrase again:

Your identification has been saved in /root/.ssh/id_rsa.

Your public key has been saved in /root/.ssh/id_rsa.pub.

The key fingerprint is:

c6:7e:57:59:0a:2d:85:49:23:cc:c4:58:ff:db:5b:38 root@master

通过以上命令将在/root/.ssh/ 目录下生成 id_rsa 私钥和 id_rsa.pub 公钥。进

入/root/.ssh 目录在 namenode 节点下做如下配置：

[root@master .ssh]# cat id_rsa.pub > authorized_keys

配置完毕，可通过 ssh 本机 IP 测试是否需要密码登录。

2. JDK 安装及 Java 环境变量的配置

下载后可阅读完整内容，剩余8页未读，立即下载

a597096867

粉丝: 0
资源: 1

Linux CentOS下Hadoop伪分布式安装全攻略

Hadoop 安装文档

Hadoop安装文档.pdf

双节点hadoop安装文档

hadoop命令.chm文档下载

hadoop 安装到windows

linux hadoop安装

hadoop安装详细步骤

hadoop安装配置MapReduce

hadoop安装步骤简述截图

ubuntu的hadoop安装与配置

最新资源