ubuntu安装hadoop伪分布式
时间: 2023-06-05 07:48:07 浏览: 125
1. 安装Java环境
在Ubuntu上安装Hadoop之前,需要先安装Java环境。可以通过以下命令安装OpenJDK:
sudo apt-get update
sudo apt-get install openjdk-8-jdk
2. 下载和解压Hadoop
从Hadoop官网下载最新版本的Hadoop,并解压到一个目录中。例如:
wget https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-3.3./hadoop-3.3..tar.gz
tar -xzvf hadoop-3.3..tar.gz
sudo mv hadoop-3.3. /usr/local/hadoop
3. 配置Hadoop
进入Hadoop的安装目录,编辑etc/hadoop/hadoop-env.sh文件,设置JAVA_HOME环境变量:
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
编辑etc/hadoop/core-site.xml文件,设置Hadoop的默认文件系统和数据存储路径:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:900</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop/tmp</value>
</property>
</configuration>
编辑etc/hadoop/hdfs-site.xml文件,设置Hadoop的数据副本数和数据块大小:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.blocksize</name>
<value>134217728</value>
</property>
</configuration>
编辑etc/hadoop/mapred-site.xml文件,设置MapReduce框架的运行模式:
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
编辑etc/hadoop/yarn-site.xml文件,设置YARN资源管理器的运行模式和节点管理器的地址:
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>localhost</value>
</property>
</configuration>
4. 格式化Hadoop文件系统
在Hadoop的安装目录下执行以下命令,格式化Hadoop文件系统:
bin/hdfs namenode -format
5. 启动Hadoop
在Hadoop的安装目录下执行以下命令,启动Hadoop:
sbin/start-all.sh
6. 验证Hadoop安装
在浏览器中访问http://localhost:8088,可以看到YARN资源管理器的Web界面。在浏览器中访问http://localhost:987,可以看到HDFS的Web界面。在命令行中执行以下命令,可以验证Hadoop是否正常运行:
bin/hadoop fs -mkdir /test
bin/hadoop fs -ls /
阅读全文