Eclipse中配置并运行Hadoop-0.20.1伪分布式教程

5星 · 超过95%的资源需积分: 9 73 浏览量更新于2024-09-13 收藏 1.55MB DOC 举报

在本文档中，我们将详细介绍如何在Eclipse环境中编译和运行Hadoop-0.20.1的源码，特别是在Linux环境下进行Hadoop的伪分布式部署。以下是步骤详解： 1. **环境准备**: 首先，确认Eclipse的JDK和JRE版本需在1.6及以上，因为Hadoop-0.20.1依赖于这些版本。这对于代码的正确编译至关重要。 2. **下载与配置**: 下载Hadoop-0.20.1的源码包，并进行解压。然后将其配置为伪分布式模式，这通常涉及修改`conf/hadoop-env.sh`和`conf/core-site.xml`等配置文件，以适应单机环境下的运行。 3. **Eclipse项目设置**: 在Eclipse中创建一个新的Java项目，命名为hadoop-0.20.1，并选择"Create project from existing source"选项，指定hadoop-0.20.1源码目录。接下来，添加配置文件到项目的类路径中，通过"Libraries"界面，将"conf"文件夹添加为Class Folder，并确保它被放在"Order and Export"的顶部，以便在编译时能找到配置。 4. **源码导入及错误处理**: 如果直接导入源码，可能会遇到编译错误，提示缺少依赖或配置问题。这时，需要忽略这两处错误，因为它们不影响运行Hadoop的源程序。确保你的项目设置正确后，可以继续后续步骤。 5. **启动Hadoop**: 在hadoop-0.20.1目录下，首先执行`bin/hadoop namenode -format`来格式化Hadoop文件系统，然后运行`bin/start-all.sh`命令启动Hadoop集群。 6. **编译与运行示例**: 使用Eclipse编译src/examples中的WordCount示例程序。具体操作包括：选择该文件夹，右键选择"Build Project"，然后执行WordCount类，如`bin/hadoop jar target/hadoop-examples-0.20.1.jar wordcount input output`，这里`input`和`output`分别指输入数据和输出结果的位置。通过这些步骤，你可以在Eclipse环境中成功地编译和运行Hadoop-0.20.1的源码，实现了在Linux环境下的Hadoop伪分布式测试。这不仅有助于理解Hadoop的工作原理，也是学习和调试Hadoop早期版本的好方法。

Linux 中使用 eclipse 编译运行 hadoop-0.20.1 源码

Linux 中使用 Eclipse 编译运行 Hadoop-0.20.1 源码

说明：在 hadoop 伪分布式模式下，编译运行 hadoop 的

源码，在集群中运行。

(0)确保 Eclipse 的 JDK、JRE 是 1.6 以上(包含 1.6)。

(1)下载 hadoop-0.20.1,并解压，配置为伪分布式模式。

(2)在 eclipse 中新建一个 Java Project，名字自己定义(hadoop-0.20.1)，选

择"Create project from existing source"，选择 hadoop-0.20.1 目录。

下一步，切换到"Libraries",选择"Add Class Folder..." 按钮，从列

表中选择"conf";

切换到"Order and Export"找到"conf"，点击 top 把它移到顶端;

下载后可阅读完整内容，剩余3页未读，立即下载

lk525164542

粉丝: 1
资源: 10

Eclipse中配置并运行Hadoop-0.20.1伪分布式教程

Hadoop-0.20.1+API

eclipse运行mr插件hadoop-eclipse-plugin-2.6.0.jar

hadoop-0.20.1-eclipse-plugin.jar

hadoop-eclipse-plugins:hadoop-2.2-eclipse-plugin, hadoop-0.21-eclipse-plugin

hadoop-0.20.1.tar.gz下载

Ubuntu 8.10下Hadoop-0.20.1集群配置手册

Ubuntu 8.10下Hadoop-0.20.1集群配置详细手册

编译hadoophadoop-3.2.2-src源码

maven-hadoop-plugin-0.20.1-sources.jar

maven-hadoop-plugin-0.20.1.jar

最新资源