Hadoop 3.2.1 单机伪分布集群快速部署教程
160 浏览量
更新于2024-09-02
收藏 64KB PDF 举报
本文档详细介绍了如何在Linux虚拟机(CentOS 7.x 64位)上安装Hadoop 3.2.1的单机伪分布集群,以便进行HDFS(Hadoop Distributed File System)和YARN(Yet Another Resource Negotiator)的初步学习和实践。以下是安装过程中的关键步骤:
1. **准备环境**:
- 使用一台具有IPv4地址(例如192.168.2.100)的CentOS 7虚拟机,并将其hostname设置为hadoop100。设置主机名是集群配置的重要步骤,分为临时和永久两种方式:
- 临时设置:`hostname hadoop100`
- 永久设置:编辑`/etc/sysconfig/network`,将`HOSTNAME`设置为"hadoop100"。
2. **hosts文件配置**:
- 在`/etc/hosts`文件中添加主机名与IP的映射,如`192.168.2.100 hadoop100`,确保与虚拟机的实际IP对应。
3. **关闭防火墙**:
- 临时关闭防火墙:`service iptables stop`
- 永久关闭防火墙:使用`chkconfig iptables off`确保防火墙不再自动启动。
4. **SSH免密登录**:
- 生成并配置SSH密钥对,通过命令`ssh-keygen -t rsa`完成,生成的密钥通常存储在`/root/.ssh/id_rsa`。
5. **安装Hadoop**:
- 在单机伪分布模式下,Hadoop的安装通常仅需下载Hadoop发行版包,并解压至适当的目录,然后配置环境变量,如`export HADOOP_HOME`,以及修改`core-site.xml`、`hdfs-site.xml`等核心配置文件。
6. **启动服务**:
- 启动HDFS服务:`sbin/start-dfs.sh`
- 启动YARN服务:`sbin/start-yarn.sh`
- 确认服务是否启动成功,可以通过命令`jps`查看进程列表。
7. **验证安装**:
- 可以通过HDFS的命令行工具如`hadoop fs -ls`来测试文件系统的操作,或者通过YARN的Web UI(默认端口8088)查看集群状态。
8. **注意事项**:
- 由于这是单机伪分布环境,所有节点功能由单一节点模拟,不能完全体现分布式计算的特性,适用于学习和测试环境。
这些步骤详细描述了Hadoop 3.2.1单机伪分布集群的安装过程,包括基础环境配置、安全设置和系统服务的启动与验证。通过这个过程,读者能够了解Hadoop的基本架构和部署方法。
2020-06-28 上传
2021-01-09 上传
2021-01-20 上传
2020-05-17 上传
2016-07-25 上传
2014-09-09 上传
2021-10-11 上传
点击了解资源详情
weixin_38741966
- 粉丝: 2
- 资源: 915
最新资源
- IEEE 14总线系统Simulink模型开发指南与案例研究
- STLinkV2.J16.S4固件更新与应用指南
- Java并发处理的实用示例分析
- Linux下简化部署与日志查看的Shell脚本工具
- Maven增量编译技术详解及应用示例
- MyEclipse 2021.5.24a最新版本发布
- Indore探索前端代码库使用指南与开发环境搭建
- 电子技术基础数字部分PPT课件第六版康华光
- MySQL 8.0.25版本可视化安装包详细介绍
- 易语言实现主流搜索引擎快速集成
- 使用asyncio-sse包装器实现服务器事件推送简易指南
- Java高级开发工程师面试要点总结
- R语言项目ClearningData-Proj1的数据处理
- VFP成本费用计算系统源码及论文全面解析
- Qt5与C++打造书籍管理系统教程
- React 应用入门:开发、测试及生产部署教程