Hadoop2.x端口详解:Namenode与YARN组件功能及配置
需积分: 45 146 浏览量
更新于2024-08-13
收藏 2.29MB PPT 举报
本文主要介绍了Hadoop环境中的关键端口配置以及Hadoop2.x的主要组件和功能。首先,我们关注的是Hadoop的端口,包括:
1. Namenode的常用端口:
- 9000:这是namenode的服务端口,通常用于内部通信。
- 8020:RPC调用端口,客户端通过这个端口请求文件系统metadata信息。
- 50070:HTTP接口,用于HDFS的Web界面查看,提供文件系统视图和管理工具。
- 50470:HTTPS版本的50070端口,提供更安全的访问方式。
- 50090:SecondaryNamenode的端口,用于维护元数据的备份和一致性检查。
- 8030-8033:这些端口属于ResourceManager,与YARN的资源管理和调度有关。
接着,文章详细解释了Hadoop2.x的核心模块:
- Hadoop Common:提供了基础库和服务,支持其他模块的运行。
- Hadoop DFS(分布式文件系统):高可靠性和高吞吐量的文件存储系统,由NameNode和DataNode组成。
- Hadoop MapReduce:分布式离线并行计算框架,负责任务分割、资源申请和容错处理。
- Hadoop YARN:新一代的MapReduce框架,集成了任务调度和资源管理功能。
此外,文章还涵盖了HDFS系统架构,NameNode作为元数据存储节点,DataNode存储实际数据,而SecondaryNameNode负责定期备份元数据。YARN架构中,ResourceManager负责资源管理和ApplicationMaster的应用程序管理,NodeManager则在每个节点上执行具体任务的Container管理。
最后,文章介绍了Hadoop2.7.1伪分布式安装过程,包括关闭防火墙、设置IP地址、配置网络映射文件、安装Java和Hadoop,以及配置多个核心配置文件如hadoop-env.sh、core-site.xml等。
在整个Hadoop环境中,正确理解和配置这些端口以及组件对于系统的稳定运行至关重要。通过掌握这些信息,用户可以有效地搭建和管理Hadoop环境,进行大数据处理和分析。
193 浏览量
186 浏览量
918 浏览量
2021-07-14 上传
452 浏览量
2015-01-25 上传
2021-10-14 上传
193 浏览量
160 浏览量
涟雪沧
- 粉丝: 23
- 资源: 2万+
最新资源
- 易语言超级列表框进度条
- CircleFun
- easy-tips:使用Go&PHP的代码职业中的一些提示:partying_face::partying_face::partying_face:
- 动画使图像实现动画效果
- React-Authentication-Burj-Al-Arab
- MT4跟单软件_mt4跟单_跟单_mt4跟单_跟单EA_ea
- 根据hostname自动获取目标设备的IPv4和Ipv6地址,并申请socket的模块
- 易语言超级列表框转HTML
- postcss-atcss-constant:ACSS禁止规则级联的模块
- XcodeProj::memo:读取,更新和编写Xcode项目
- KiLib-OSS:KiLib开源
- 易语言超级列表框读取自定义的配置内容
- PiBoom:通过树莓派上的 GPIO 按钮控制 MusicBox
- rentry:命令行中的Markdown pastebin
- 1click-calculator
- 精品图片站