伪分布式 Hadoop 集群
时间: 2025-01-01 16:26:25 浏览: 9
### 设置单节点伪分布式Hadoop集群
#### 1. 安装Java环境
为了运行Hadoop,需要先安装JDK。可以通过以下命令来安装OpenJDK:
```bash
sudo apt-get update
sudo apt-get install openjdk-8-jdk
```
验证安装成功可以使用`java -version`命令。
#### 2. 下载并解压Hadoop软件包
前往Apache官方网站下载适合版本的Hadoop压缩文件,并将其放置到期望的位置进行解压[^1]。
```bash
tar zxvf hadoop-x.x.x.tar.gz -C /usr/local/
cd /usr/local && ln -s ./hadoop-x.x.x/ hadoop
```
#### 3. 修改配置文件
进入Hadoop目录下的etc/hadoop路径下编辑核心配置文件core-site.xml, hdfs-site.xml以及yarn-site.xml等几个主要XML格式的配置文档。
对于单节点伪分布式的场景来说,在这些文件里添加必要的属性即可完成基本设置。比如在`core-site.xml`中指定临时存储位置;而在`hdfs-site.xml`里面定义NameNode的数据保存地址等等。
#### 4. 启动服务
启动之前要确保已经正确设置了SSH无密码登录本机,因为这一步骤会涉及到通过ssh连接localhost来进行操作。
执行如下指令依次开启Namenode、Datanode以及其他相关组件的服务进程:
```bash
sbin/start-dfs.sh
sbin/start-yarn.sh
```
此时应该可以在浏览器访问http://localhost:50070查看Web UI界面确认是否正常工作了。
阅读全文