CDH集群安装指南:Cloudera Manager部署与服务角色分配
4星 · 超过85%的资源 需积分: 10 193 浏览量
更新于2024-07-19
1
收藏 2.32MB PDF 举报
"本文档详细介绍了在CentOS 6.x/RedHat 6.x系统上安装CDH(Cloudera Distribution Including Hadoop)的过程,特别关注Cloudera Manager的部署和大数据组件的安装。适用于3个或5个节点的集群配置,同时也列出了安装CDH所需的软硬件和操作系统要求。"
在大数据领域,CDH是由Cloudera公司提供的一个全面的开源大数据平台,包含了多种Apache Hadoop生态系统组件,如HDFS、MapReduce、HBase等。Cloudera Manager(CM)是一个强大的管理工具,用于简化CDH集群的部署、管理和监控。
1. CDH节点安装和服务角色安装规划
- CM由Server和Agent两部分构成。Server节点负责集群的管理和监控,而Agent节点在所有参与CDH服务的节点上运行,执行Server的指令并报告状态。
- 对于3个节点的场景,Server节点(node1)同时运行CMdaemon、CMserver和CMagent,其余两个节点(node2和node3)只运行CMdaemon和CMagent。
- 对于5个节点的场景,Server节点(node1)仅运行CMdaemon和CMserver,其他四个节点(node2到node5)运行CMdaemon和CMagent。这种分配可以提供更平衡的服务分布。
2. 安装CDH的软硬件要求
- 硬件要求:为了保证高可用性,集群至少需要3台物理服务器,且不推荐混用虚拟机。生产环境建议每节点64GB内存、8核CPU和1TB磁盘,测试开发环境则可适当降低配置。
- 操作系统要求:支持RedHat 6或7以及CentOS 6或7。
- 软件要求:除了CDH parcel文件,还需要JDK、Cloudera Manager RPM包、MariaDB(或MySQL)以及对应的驱动包。
3. 集群的角色分配
- 角色分配应确保服务的均衡分布,避免将所有服务集中在一个节点上。例如,3个节点的集群,可以将HDFS NameNode、HBase Master等关键服务放在Server节点,DataNode和RegionServer等分布在其他节点。
4. 安装步骤
- 首先,需要在所有节点上安装JDK和Cloudera Manager的RPM包,然后在Server节点启动CM Server。
- 接下来,通过CM Server部署CDH parcel文件,这会自动在各个Agent节点上安装和配置所需的大数据组件。
- 最后,配置集群服务,包括设置安全策略、网络通信和资源调度等。
5. 注意事项
- 确保所有节点间网络通畅,对于生产环境,建议使用千兆以上的网络接口。
- 遵循最佳实践,比如使用专用的硬件资源,避免与其他服务共享,以提高性能和稳定性。
CDH的安装是一个涉及多步骤、多组件的过程,需要细心规划和精确执行。Cloudera Manager作为核心管理工具,简化了这一过程,但正确配置硬件和软件环境仍然是成功部署的关键。
2018-01-03 上传
2019-08-12 上传
2020-04-29 上传
kankao_68
- 粉丝: 0
- 资源: 6
最新资源
- zlib-1.2.12压缩包解析与技术要点
- 微信小程序滑动选项卡源码模版发布
- Unity虚拟人物唇同步插件Oculus Lipsync介绍
- Nginx 1.18.0版本WinSW自动安装与管理指南
- Java Swing和JDBC实现的ATM系统源码解析
- 掌握Spark Streaming与Maven集成的分布式大数据处理
- 深入学习推荐系统:教程、案例与项目实践
- Web开发者必备的取色工具软件介绍
- C语言实现李春葆数据结构实验程序
- 超市管理系统开发:asp+SQL Server 2005实战
- Redis伪集群搭建教程与实践
- 掌握网络活动细节:Wireshark v3.6.3网络嗅探工具详解
- 全面掌握美赛:建模、分析与编程实现教程
- Java图书馆系统完整项目源码及SQL文件解析
- PCtoLCD2002软件:高效图片和字符取模转换
- Java开发的体育赛事在线购票系统源码分析