Ubuntu上Hadoop的安装配置与运行教程

需积分: 9 46 浏览量更新于2024-07-29 收藏 680KB PDF 举报

"这篇文档详细介绍了在Linux Ubuntu 9.10环境下安装、配置和运行Hadoop 0.20.0的过程，作者是上海电力学院计算机与信息工程学院的周耀君。文档包含了从系统需求到配置流程的全部步骤，并提到了在Eclipse中运行Hadoop自带的WordCount示例。" 在现代大数据处理领域，Hadoop是一个关键的开源框架，它允许分布式存储和处理大规模数据集。本文档主要针对Hadoop初学者，详细讲述了如何在Linux环境中搭建Hadoop环境。首先，系统需求包括Linux Ubuntu 9.10操作系统，这是Hadoop运行的基础。你可以从Ubuntu官网免费下载最新版本。此外，需要安装Hadoop 0.20.0，可以从Apache的镜像服务器获取。Sun-java6-jdk是运行Hadoop的必备组件，可以通过`apt-get install sun-java6-jdk`命令安装。SSH用于远程登录，而Eclipse则作为开发环境，可以运行Hadoop的Java程序。接下来是配置流程： 1. 安装Ubuntu 9.04。确保操作系统是最新的，通过`sudo apt-get update`更新deb软件包列表，然后使用`sudo apt-get upgrade`进行系统更新。 2. 安装JDK。使用`sudo apt-get install sun-java6-jdk`命令，安装过程中使用TAB键选择OK。 3. 设置默认Java。通过`sudo update-alternatives --config java`选择java-6-sun作为默认Java程序，再用`sudo update-java-alternatives -s java-6-sun`确认设置。 4. 配置环境变量。这包括设置CLASSPATH和JAVA_HOME，这些可以在系统的环境变量中进行。通常，你需要编辑`/etc/environment`或`/etc/profile`文件来添加这些变量。配置完成后，Hadoop的安装和配置还需要进一步的步骤，如设置Hadoop的环境变量，配置Hadoop的配置文件（如core-site.xml、hdfs-site.xml、mapred-site.xml等），格式化NameNode，启动DataNode和TaskTracker等服务。最后，文档提到了在Eclipse中运行Hadoop自带的WordCount示例，这是一个基础的MapReduce程序，用于统计文本文件中单词出现的次数。这对于测试Hadoop环境是否正常工作非常重要。整个过程旨在帮助用户理解Hadoop的部署和运行机制，以及如何在实际开发环境中集成Hadoop。虽然这个文档基于较旧的Hadoop版本和Ubuntu版本，但基本的安装和配置流程对于理解Hadoop的核心概念仍然是有价值的。对于新手来说，这是一个很好的起点，可以在此基础上学习更高级的Hadoop操作和管理。

上海电力学院计算机与信息工程学院撰写人 : 周耀君 QQ:648134235

$ sudo bin/hadoop namenode -format

10/02/21 00:15:08 INFO namenode.NameNode: STARTUP_MSG:

/************************************************************

STARTUP_MSG: Starting NameNode

STARTUP_MSG: host = master/127.0.1.1

STARTUP_MSG: args = [-format]

STARTUP_MSG: version = 0.20.0

STARTUP_MSG: build =

https://svn.apache.org/repos/asf/hadoop/core/branches/branch-0.20

-r 763504; compiled by 'ndaley' on Thu Apr 9 05:18:40 UTC 2009

************************************************************/

10/02/21 00:15:09 INFO namenode.FSNamesystem: fsOwner=root,root

10/02/21 00:15:09 INFO namenode.FSNamesystem:

supergroup=supergroup

10/02/21 00:15:09 INFO namenode.FSNamesystem:

isPermissionEnabled=true

10/02/21 00:15:09 INFO common.Storage: Image file of size 94

saved in 0 seconds.

10/02/21 00:15:09 INFO common.Storage: Storage directory

/tmp/hadoop-root/dfs/name has been successfully formatted.

10/02/21 00:15:09 INFO namenode.NameNode: SHUTDOWN_MSG:

/************************************************************

SHUTDOWN_MSG: Shutting down NameNode at master/127.0.1.1

************************************************************/

(三) 启动 hadoop 监护进程

命令 $ bin/start-all.sh

starting namenode, logging to

/home/shiep205/hadoop/bin/../logs/hadoop-shiep205-namenode-

master.out

localhost: starting datanode, logging to

/home/shiep205/hadoop/bin/../logs/hadoop-shiep205-datanode-

- 5 -

剩余24页未读，继续阅读

andy.L

粉丝: 5
资源: 6

Ubuntu上Hadoop的安装配置与运行教程

hadoop配置运行错误

hadoop安装配置文档.pdf

安装hadoop_配置hadoop的运行环境视频

hadoop安装配置MapReduce

简述Hadoop分布式安装、配置、测试（指验证Hadoop正确运行）过程。

idea配置hadoop运行环境

在非hadoop集群上运行hadoop命令

搭建Hadoop大数据运行环境

hadoop安装配置步骤虚拟机

linux安装hadoop配置slaves

最新资源