离线安装指南:Cloudera Manager与CHD5.3.3集群

需积分: 12 6 下载量 176 浏览量 更新于2024-07-19 1 收藏 1.67MB PDF 举报
本文档介绍了如何进行Cloudera Manager和CHD5.3.3集群的离线安装步骤,包括必要的软件包准备、服务器环境设置以及配置细节。 Cloudera Manager是Cloudera公司提供的一个管理工具,用于简化Apache Hadoop及其相关服务的部署、管理和监控。CHD(Cloudera Hadoop Distribution)是Cloudera基于Hadoop发行的版本,包含了Hadoop生态系统中的各种组件,如HDFS、YARN、MapReduce、HBase等。 离线安装Cloudera Manager和CHD5.3.3集群主要涉及以下步骤: 1. **准备相关软件包**: - CM (Cloudera Manager) 包:需要从官方仓库下载`cloudera-manager-el6-cm5.1.3_x86_64.tar`。 - CDH (Cloudera Data Hub) 安装包:从`http://archive.cloudera.com/cdh5/parcels/`获取,注意要对SHA1校验文件进行重命名并更新manifest.json文件。 2. **系统准备**: - 卸载默认的JDK和MySQL,因为Cloudera Manager会提供自己的版本。 - 主机名设置:确保主机名中不含下划线,因为Cloudera Manager不支持。 - 安装位置:建议将所有软件安装在`/opt`目录下。 - 操作系统依赖:确保系统中安装了`chkconfig`、`python 2.6`、`bind-utils`、`psmisc`、`libxslt`、`zlib`、`sqlite`、`cyrus-sasl-plain`、`cyrus-sasl-gssapi`、`fuse`、`portmap`、`fuse-libs`和`redhat-lsb`等必要的软件包。 3. **服务器环境设置**: - IP配置:为每台节点分配静态IP地址。 - 主机名配置:确保没有下划线,并且在所有节点间配置正确的主机名解析。 - 时区设置:将系统时间设置为东八区(北京时间),并重启系统。 - SSH配置:所有节点之间实现SSH免密码登录,通过`ssh-keygen`生成密钥对,然后使用`ssh-copy-id`将公钥复制到其他节点。 - 时间同步:所有节点与主节点进行时间同步,确保集群内的时钟一致。 4. **安装过程**: - 先在一台服务器上安装Cloudera Manager Server,然后在其他服务器上安装Agent。 - 使用离线模式安装CDH,这通常涉及到将CDH的Parcel文件复制到Cloudera Manager的Parcel目录,并通过Manager界面进行分发和激活。 - 配置和启动Hadoop相关的服务,如HDFS、YARN、MapReduce等。 5. **后续配置**: - 配置安全性和权限,例如使用Kerberos进行身份验证。 - 根据业务需求,安装和配置其他Cloudera Manager支持的服务,如Hive、Impala、Spark等。 - 监控和维护集群,确保所有服务运行正常。 离线安装适用于网络环境有限或者需要严格控制网络访问的场景。在实际操作中,需要根据具体的硬件配置和网络环境调整上述步骤,以确保安装过程的顺利进行。