centos镜像安装hadoop
时间: 2023-08-23 10:06:37 浏览: 124
1. 下载Hadoop镜像文件
从官网或镜像站点下载Hadoop镜像文件,例如:https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz
2. 解压Hadoop镜像文件
使用tar命令解压下载的Hadoop镜像文件:
```
tar -xzvf hadoop-3.3.1.tar.gz
```
3. 配置Hadoop环境变量
将Hadoop的bin目录添加到环境变量中,以便在任何目录下都可以直接运行Hadoop命令:
```
export HADOOP_HOME=/opt/hadoop-3.3.1
export PATH=$HADOOP_HOME/bin:$PATH
```
4. 配置Hadoop集群
进入Hadoop的conf目录,编辑core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml文件,配置Hadoop集群:
```
cd $HADOOP_HOME/etc/hadoop
vi core-site.xml
```
配置core-site.xml文件:
```xml
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
```
配置hdfs-site.xml文件:
```xml
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/opt/hadoop-3.3.1/hdfs/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/opt/hadoop-3.3.1/hdfs/datanode</value>
</property>
</configuration>
```
配置mapred-site.xml文件:
```xml
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
```
配置yarn-site.xml文件:
```xml
<configuration>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>localhost</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
</configuration>
```
5. 格式化HDFS文件系统
使用hdfs namenode -format命令格式化HDFS文件系统:
```
hdfs namenode -format
```
6. 启动Hadoop集群
使用start-all.sh命令启动Hadoop集群:
```
start-all.sh
```
7. 验证Hadoop集群
使用jps命令查看Hadoop集群进程:
```
jps
```
输出类似如下结果:
```
3537 Jps
3264 ResourceManager
3007 DataNode
3151 NodeManager
3374 SecondaryNameNode
2920 NameNode
```
表示Hadoop集群已经启动成功。
阅读全文