CDH安装部署指南:三步走详解

需积分: 12 3 下载量 74 浏览量 更新于2024-09-12 收藏 3.17MB DOCX 举报
本篇文章是关于Apache Hadoop CDH (Cloudera Distribution Hadoop) 的安装部署文档,主要针对的是在Linux环境下的三台虚拟机(zgl-1, zgl-2, zgl-3)进行部署。部署过程包括以下几个关键步骤: 1. **部署环境准备**: 文档首先指定了三台机器的IP地址和各自的角色,如zgl-1主要用于MySQLCM-server和相关组件,而zgl-2和zgl-3则主要负责cm-agent和ZooKeeper。这表明这些机器将作为CDH集群的不同组成部分。 2. **软件包上传**: 在/zgl-1的机器上,作者上传了多个必要的软件包,包括JDK 8, MySQL 5.6.23,MySQL Connector Java,CDH 5.10.0的安装包以及manifest.json文件。这些软件包对于构建CDH环境至关重要。 3. **安装MySQL(zgl-1)**: 安装步骤具体包括解压安装包,将mysql-5.6.23重命名,创建mysql用户和dba组,确保用户权限正确设置,以及配置my.cnf文件。这涉及到数据库的基础配置,如监听端口、socket路径和内存管理参数。 4. **配置文件调整**: 配置文件的修改旨在优化MySQL性能,如设置合理的缓冲区大小以提高读写效率,并禁用外部锁定,确保并发访问性能。 5. **后续安装流程**: 文档省略了在其他机器上安装和配置CM-Agent、Namenode、DataNode等CDH组件的详细步骤,但可以推断这部分内容会涉及HDFS(Hadoop Distributed File System)和YARN(Yet Another Resource Negotiator)的搭建,以及Hive、Pig等数据处理工具的安装。 这篇文档提供了一个基础的CDH 5.10.0部署框架,涵盖了从基础环境配置到核心组件安装的步骤。阅读者可以通过这个文档了解如何在一个集群环境中部署和管理CDH,但实际操作可能需要根据组织的具体需求和环境进行定制化调整。如果你计划在企业级环境中部署CDH,理解和遵循这些步骤是非常重要的,同时还需要对CDH架构、组件及其依赖关系有深入的理解。