CentOS搭建hadoop

### 安装和配置Hadoop集群 #### 准备工作为了在 CentOS 上成功搭建 Hadoop 集群，需先确保所有节点的操作系统已更新至最新版本并安装必要的依赖包[^1]。 ```bash sudo yum update -y sudo yum install java-1.8.0-openjdk-devel -y ``` #### 下载与解压 Hadoop 前往 Apache 官方网站下载适合的 Hadoop 版本，并将其放置于合适目录下完成解压缩操作。 ```bash wget https://archive.apache.org/dist/hadoop/core/hadoop-3.3.4/hadoop-3.3.4.tar.gz tar zxvf hadoop-3.3.4.tar.gz -C /usr/local/ ln -s /usr/local/hadoop-3.3.4 /usr/local/hadoop ``` #### 修改环境变量编辑 `~/.bashrc` 文件，在文件末尾追加如下内容以便设置 Hadoop 的环境变量： ```bash export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-amd64 export HADOOP_INSTALL=/usr/local/hadoop export PATH=$PATH:$HADOOP_INSTALL/bin export PATH=$PATH:$HADOOP_INSTALL/sbin export HADOOP_MAPRED_HOME=${HADOOP_INSTALL} export HADOOP_COMMON_HOME=${HADOOP_INSTALL} export HADOOP_HDFS_HOME=${HADOOP_INSTALL} export YARN_HOME=${HADOOP_INSTALL} source ~/.bashrc ``` #### 编辑核心配置文件进入 `/usr/local/hadoop/etc/hadoop/` 目录修改以下四个主要配置文件：core-site.xml, hdfs-site.xml, yarn-site.xml 和 mapred-site.xml。这些文件用于定义整个分布式系统的参数设定以及各组件之间的交互方式。对于单 Master 多 Slave 架构而言，具体调整如下所示（假设 IP 地址分别为 master: 192.168.1.100; slave1: 192.168.1.101; slave2: 192.168.1.102） ##### core-site.xml ```xml <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://master:9000</value> </property> </configuration> ``` ##### hdfs-site.xml ```xml <configuration> <property> <name>dfs.replication</name> <value>2</value> </property> <property> <name>dfs.namenode.http-address</name> <value>master:50070</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>/data/hdfs/datanode</value> </property> </configuration> ``` ##### yarn-site.xml ```xml <configuration>  <property> <name>yarn.resourcemanager.hostname</name> <value>master</value> </property>  <property> <name>yarn.nodemanager.local-dirs</name> <value>/data/yarn/local</value> </property>  <property> <name>yarn.log-aggregation-enable</name> <value>true</value> </property> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> </configuration> ``` ##### mapred-site.xml ```xml <configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration> ``` #### 初始化 NameNode 并启动服务回到 Master 节点执行初始化命令之后再依次开启各个守护进程。 ```bash /usr/local/hadoop/bin/hdfs namenode -format start-all.sh jps ``` 通过以上步骤即可实现基于 CentOS 操作系统的简易版 Hadoop 集群部署过程。

阅读全文

大家在看

GL3231S USB4.0读卡器Layout和原理图及相关的FW

keb变频器 f5中文说明书-维修安装调试

IPC-7351 使用说明

实验二DML语言一（数据插入、修改和删除.doc

ZYNQ_7020核心板原理图.pdf

最新推荐

免安装JDK 1.8.0_241：即刻配置环境运行

管理建模和仿真的文件

【提升效率与稳定性】：深入掌握单相整流器的控制策略

你看这是ashx映射的cs文件初始代码,你看这里边根本就没有写对action参数进行任何操作但你.ashx?action=submit这样去做他就能返回出数据这是为什么

机器学习预测葡萄酒评分：二值化品尝笔记的应用

"互动学习：行动中的多样性与论文攻读经历"

【单相整流器终极指南】：电气工程师的20年实用技巧大揭秘

OxyPlot CategoryAxis

STM32-F0/F1/F2电子库函数UCOS开发指南

关系数据表示学习