ubuntu18.04搭建伪分布式Hadoop环境
时间: 2023-09-11 18:07:10 浏览: 132
ubuntu环境下hadoop环境搭建(伪分布模式)
好的,下面是搭建伪分布式Hadoop环境的步骤:
1. 安装Java
Hadoop需要Java环境,所以需要先安装Java。
```
sudo apt-get update
sudo apt-get install default-jdk
```
2. 安装Hadoop
下载Hadoop安装包并解压:
```
wget https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.10.1/hadoop-2.10.1.tar.gz
tar -xzvf hadoop-2.10.1.tar.gz
sudo mv hadoop-2.10.1 /usr/local/hadoop
```
3. 配置Hadoop环境变量
打开hadoop-env.sh文件进行编辑:
```
sudo nano /usr/local/hadoop/etc/hadoop/hadoop-env.sh
```
将以下内容添加到文件的末尾:
```
export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
```
保存并退出。
4. 配置Hadoop
打开core-site.xml文件进行编辑:
```
sudo nano /usr/local/hadoop/etc/hadoop/core-site.xml
```
将以下内容添加到文件的末尾:
```
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
```
保存并退出。
打开hdfs-site.xml文件进行编辑:
```
sudo nano /usr/local/hadoop/etc/hadoop/hdfs-site.xml
```
将以下内容添加到文件的末尾:
```
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/hadoop/hadoop_data/hdfs/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/usr/local/hadoop/hadoop_data/hdfs/datanode</value>
</property>
</configuration>
```
保存并退出。
5. 格式化Hadoop文件系统
运行以下命令来格式化Hadoop文件系统:
```
hdfs namenode -format
```
6. 启动Hadoop
运行以下命令来启动Hadoop:
```
start-all.sh
```
7. 检查Hadoop状态
运行以下命令来检查Hadoop状态:
```
jps
```
如果一切正常,你应该看到以下进程:
```
NameNode
SecondaryNameNode
DataNode
ResourceManager
NodeManager
```
这样,伪分布式Hadoop环境就搭建完成了。
阅读全文