首页ubuntu安装单机Hadoop和伪分布式安装

ubuntu安装单机Hadoop和伪分布式安装

时间: 2024-11-11 13:12:47 浏览: 5

Ubuntu上安装单机Hadoop和伪分布式环境通常用于本地测试和学习，以下是简要步骤： **单机模式安装（SingleNode Mode）**： 1. **更新系统**：打开终端并运行 `sudo apt-get update && sudo apt-get upgrade`。 2. **安装基本依赖**：`sudo apt-get install -y curl tar openssh-server vim` 3. **下载Hadoop源码**：访问Apache Hadoop官网下载适用于Ubuntu的版本，比如 `wget http://www.apache.org/dist/hadoop/common/hadoop-3.x.x/hadoop-3.x.x.tar.gz`。 4. **解压并配置**：`tar -xzf hadoop-3.x.x.tar.gz`，进入目录后修改配置文件如 `conf/core-site.xml`、`hdfs-site.xml` 和 ` yarn-site.xml`。 5. **设置环境变量**：编辑 `.bashrc` 或 `.bash_profile` 添加Hadoop环境变量。 6. **启动服务**：`cd hadoop-3.x.x`，然后运行 `sbin/start-dfs.sh` 和 `sbin/start-yarn.sh` 启动HDFS和YARN。 **伪分布式模式安装（pseudo-distributed mode）**： 1. 还是在单机模式下，不需要实际部署守护进程，而是模拟集群行为。 2. 配置 `conf/hadoop-env.sh`，设置`JAVA_HOME`、`HADOOP_HOME` 等，并将`HADOOP_CONF_DIR`指向配置文件夹。 3. 修改`conf/hadoop-site.xml`，设置`<property>`标签，如 `<property> <name>fs.defaultFS</name> <value>file:///</value></property>`，表示所有数据存储在本地文件系统。 4. 使用命令行工具如 `hadoop fs`, `hadoop jar`，它们会在本地执行，模拟集群操作。

阅读全文