Hadoop 3.2.1 单机伪分布集群快速部署教程
15 浏览量
更新于2024-09-02
收藏 64KB PDF 举报
本文档详细介绍了如何在Linux虚拟机(CentOS 7.x 64位)上安装Hadoop 3.2.1的单机伪分布集群,以便进行HDFS(Hadoop Distributed File System)和YARN(Yet Another Resource Negotiator)的初步学习和实践。以下是安装过程中的关键步骤:
1. **准备环境**:
- 使用一台具有IPv4地址(例如192.168.2.100)的CentOS 7虚拟机,并将其hostname设置为hadoop100。设置主机名是集群配置的重要步骤,分为临时和永久两种方式:
- 临时设置:`hostname hadoop100`
- 永久设置:编辑`/etc/sysconfig/network`,将`HOSTNAME`设置为"hadoop100"。
2. **hosts文件配置**:
- 在`/etc/hosts`文件中添加主机名与IP的映射,如`192.168.2.100 hadoop100`,确保与虚拟机的实际IP对应。
3. **关闭防火墙**:
- 临时关闭防火墙:`service iptables stop`
- 永久关闭防火墙:使用`chkconfig iptables off`确保防火墙不再自动启动。
4. **SSH免密登录**:
- 生成并配置SSH密钥对,通过命令`ssh-keygen -t rsa`完成,生成的密钥通常存储在`/root/.ssh/id_rsa`。
5. **安装Hadoop**:
- 在单机伪分布模式下,Hadoop的安装通常仅需下载Hadoop发行版包,并解压至适当的目录,然后配置环境变量,如`export HADOOP_HOME`,以及修改`core-site.xml`、`hdfs-site.xml`等核心配置文件。
6. **启动服务**:
- 启动HDFS服务:`sbin/start-dfs.sh`
- 启动YARN服务:`sbin/start-yarn.sh`
- 确认服务是否启动成功,可以通过命令`jps`查看进程列表。
7. **验证安装**:
- 可以通过HDFS的命令行工具如`hadoop fs -ls`来测试文件系统的操作,或者通过YARN的Web UI(默认端口8088)查看集群状态。
8. **注意事项**:
- 由于这是单机伪分布环境,所有节点功能由单一节点模拟,不能完全体现分布式计算的特性,适用于学习和测试环境。
这些步骤详细描述了Hadoop 3.2.1单机伪分布集群的安装过程,包括基础环境配置、安全设置和系统服务的启动与验证。通过这个过程,读者能够了解Hadoop的基本架构和部署方法。
点击了解资源详情
点击了解资源详情
点击了解资源详情
2021-01-20 上传
2020-05-17 上传
2016-07-25 上传
2014-09-09 上传
2021-10-11 上传
点击了解资源详情
weixin_38741966
- 粉丝: 2
- 资源: 915
最新资源
- nanonote:一种简约的笔记应用程序
- IT-manuale-del-software-developer:软件开发人员指南
- TrackingDoc-crx插件
- C_Repository:C ++代码
- tsv2vcf-开源
- pandas_gbq_magic-1.1.2.tar.gz
- apollo-ps3:阿波罗保存工具(PS3)
- snews v1.7.1 英文版
- rmt:SUSE Customer Center的RPM存储库镜像工具和注册代理
- my_vim:我的vimrc
- RebootInBot
- dmnmgr-client:DMN管理器-具有附加功能的DMN编辑器,例如验证,模拟和基本git支持
- pandas_genomics-0.12.0.tar.gz
- 参考资料-基于STC单片机的电动客车空调控制系统设计.zip
- 金蝶虚拟机补丁-编码:#13397609虚拟机补丁.zip
- ToyChat-开源