hadoop伪分布式搭建ubuntu
时间: 2023-04-29 19:01:36 浏览: 77
1. 安装Java环境
首先需要安装Java环境,可以通过以下命令安装:
sudo apt-get update
sudo apt-get install default-jdk
2. 下载Hadoop
可以在Hadoop官网上下载最新版本的Hadoop,也可以通过以下命令下载:
wget http://apache.claz.org/hadoop/common/hadoop-3.2.2/hadoop-3.2.2.tar.gz
3. 解压Hadoop
将下载的Hadoop压缩包解压到指定目录,例如:
sudo tar -xzvf hadoop-3.2.2.tar.gz -C /usr/local/
sudo mv /usr/local/hadoop-3.2.2 /usr/local/hadoop
4. 配置Hadoop环境变量
编辑~/.bashrc文件,添加以下内容:
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
执行以下命令使环境变量生效:
source ~/.bashrc
5. 配置Hadoop
进入Hadoop配置文件目录:
cd /usr/local/hadoop/etc/hadoop/
编辑hadoop-env.sh文件,将JAVA_HOME设置为Java安装路径:
export JAVA_HOME=/usr/lib/jvm/default-java
编辑core-site.xml文件,添加以下内容:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:900</value>
</property>
</configuration>
编辑hdfs-site.xml文件,添加以下内容:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/usr/local/hadoop/hadoop_data/hdfs/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/usr/local/hadoop/hadoop_data/hdfs/datanode</value>
</property>
</configuration>
编辑mapred-site.xml文件,添加以下内容:
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
编辑yarn-site.xml文件,添加以下内容:
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
</configuration>
6. 格式化Hadoop文件系统
执行以下命令格式化Hadoop文件系统:
hdfs namenode -format
7. 启动Hadoop
执行以下命令启动Hadoop:
start-all.sh
8. 验证Hadoop
在浏览器中输入http://localhost:50070/,可以看到Hadoop的Web界面,表示Hadoop已经成功搭建。
以上就是Hadoop伪分布式搭建Ubuntu的步骤,希望对你有帮助。