Hadoop 3.2.1 单机伪分布集群快速部署教程
69 浏览量
更新于2024-09-02
收藏 64KB PDF 举报
本文档详细介绍了如何在Linux虚拟机(CentOS 7.x 64位)上安装Hadoop 3.2.1的单机伪分布集群,以便进行HDFS(Hadoop Distributed File System)和YARN(Yet Another Resource Negotiator)的初步学习和实践。以下是安装过程中的关键步骤:
1. **准备环境**:
- 使用一台具有IPv4地址(例如192.168.2.100)的CentOS 7虚拟机,并将其hostname设置为hadoop100。设置主机名是集群配置的重要步骤,分为临时和永久两种方式:
- 临时设置:`hostname hadoop100`
- 永久设置:编辑`/etc/sysconfig/network`,将`HOSTNAME`设置为"hadoop100"。
2. **hosts文件配置**:
- 在`/etc/hosts`文件中添加主机名与IP的映射,如`192.168.2.100 hadoop100`,确保与虚拟机的实际IP对应。
3. **关闭防火墙**:
- 临时关闭防火墙:`service iptables stop`
- 永久关闭防火墙:使用`chkconfig iptables off`确保防火墙不再自动启动。
4. **SSH免密登录**:
- 生成并配置SSH密钥对,通过命令`ssh-keygen -t rsa`完成,生成的密钥通常存储在`/root/.ssh/id_rsa`。
5. **安装Hadoop**:
- 在单机伪分布模式下,Hadoop的安装通常仅需下载Hadoop发行版包,并解压至适当的目录,然后配置环境变量,如`export HADOOP_HOME`,以及修改`core-site.xml`、`hdfs-site.xml`等核心配置文件。
6. **启动服务**:
- 启动HDFS服务:`sbin/start-dfs.sh`
- 启动YARN服务:`sbin/start-yarn.sh`
- 确认服务是否启动成功,可以通过命令`jps`查看进程列表。
7. **验证安装**:
- 可以通过HDFS的命令行工具如`hadoop fs -ls`来测试文件系统的操作,或者通过YARN的Web UI(默认端口8088)查看集群状态。
8. **注意事项**:
- 由于这是单机伪分布环境,所有节点功能由单一节点模拟,不能完全体现分布式计算的特性,适用于学习和测试环境。
这些步骤详细描述了Hadoop 3.2.1单机伪分布集群的安装过程,包括基础环境配置、安全设置和系统服务的启动与验证。通过这个过程,读者能够了解Hadoop的基本架构和部署方法。
2020-06-28 上传
2021-01-09 上传
2021-01-20 上传
2020-05-17 上传
2016-07-25 上传
2014-09-09 上传
2021-10-11 上传
点击了解资源详情
weixin_38741966
- 粉丝: 2
- 资源: 915
最新资源
- JHU荣誉单变量微积分课程教案介绍
- Naruto爱好者必备CLI测试应用
- Android应用显示Ignaz-Taschner-Gymnasium取消课程概览
- ASP学生信息档案管理系统毕业设计及完整源码
- Java商城源码解析:酒店管理系统快速开发指南
- 构建可解析文本框:.NET 3.5中实现文本解析与验证
- Java语言打造任天堂红白机模拟器—nes4j解析
- 基于Hadoop和Hive的网络流量分析工具介绍
- Unity实现帝国象棋:从游戏到复刻
- WordPress文档嵌入插件:无需浏览器插件即可上传和显示文档
- Android开源项目精选:优秀项目篇
- 黑色设计商务酷站模板 - 网站构建新选择
- Rollup插件去除JS文件横幅:横扫许可证头
- AngularDart中Hammock服务的使用与REST API集成
- 开源AVR编程器:高效、低成本的微控制器编程解决方案
- Anya Keller 图片组合的开发部署记录