CDH5.10.0离线集群部署:HDFS、YARN、ZooKeeper与MySQL安装指南

需积分: 14 8 下载量 103 浏览量 更新于2024-07-19 收藏 3.16MB PDF 举报
"CDH5.10.0离线安装部署文档,使用3台青云云主机,安装服务包括HDFS、YARN和ZooKeeper。MySQL部署涉及下载、解压、创建组和用户以及配置my.cnf文件。" 在离线环境下部署CDH 5.10.0集群,首先需要对集群进行规划和角色分配。在这个案例中,我们有三台主机,分别是hadoop000、hadoop001和hadoop002。第一阶段的角色分配中,hadoop000将作为CM服务器(Cluster Manager Server)及CM代理(CM-Agent),而hadoop001和hadoop002则仅作为CM代理。在第二阶段,角色进一步细化,hadoop000承载NameNode、DataNode、ResourceManager和ZooKeeper服务,hadoop001作为DataNode、SecondaryNameNode、NodeManager和ZooKeeper,最后hadoop002作为DataNode、NodeManager和ZooKeeper。 HDFS(Hadoop Distributed File System)是Hadoop的核心组件,负责数据的存储。NameNode是HDFS的主节点,管理元数据,如文件系统命名空间和文件块映射信息。DataNode则是数据存储节点,存储实际的数据块。SecondaryNameNode则协助NameNode,定期合并fsimage和editlog,以防NameNode内存压力过大。 YARN(Yet Another Resource Negotiator)是Hadoop的资源管理系统,负责处理集群中应用程序的资源调度。ResourceManager是YARN的全局资源调度器,管理集群的计算资源,而NodeManager是每个节点上的守护进程,负责管理该节点上的容器(container)资源。 ZooKeeper是分布式协调服务,提供可靠的分布式一致性服务,对于Hadoop集群来说,ZooKeeper用于维护集群状态的同步,确保NameNode和其他服务的高可用性。 接下来,我们来看MySQL的部署。为了安装MySQL 5.6.23,首先需要在/usr/local目录下下载对应的二进制包,然后检查系统是否已安装MySQL。如果没有,可以解压缩并重命名文件。创建新的组(dba,组ID为101)和用户(mysqladmin,用户ID为514,属于dba组并附加到root组),并设置用户密码。接下来,在/etc目录下创建my.cnf配置文件,指定MySQL的端口、套接字位置以及其他关键配置项,如skip-external-locking,这有助于在启动时跳过外部锁定。 离线安装CDH 5.10.0时,需要预先下载所有必要的软件包,并在每台主机上手动分发和安装。这通常涉及准备一个共享文件系统或使用物理媒介来传输文件。同时,必须确保所有主机间的网络通信畅通,以便服务发现和通信。此外,配置文件的正确设置和集群的初始化是成功部署的关键步骤。在完成安装后,还需要进行服务验证和性能调优,以确保集群稳定运行。 总结来说,这个离线安装过程涵盖了CDH组件的规划、角色分配、MySQL的安装以及配置,是构建一个基本的Hadoop生态系统的必要步骤。在实际操作中,需要根据具体的业务需求和硬件资源进行相应的调整和优化。