CDH集群部署全攻略:从规划到优化
5星 · 超过95%的资源 需积分: 10 168 浏览量
更新于2024-09-09
收藏 2.19MB DOCX 举报
"CDH集群部署手册是一份详细指导如何在特定环境下规划和部署CDH(Cloudera Distribution Including Apache Hadoop)集群的手册。手册涵盖了从服务器规划、MySQL数据库安装到CDH组件的离线安装,以及高可用性设置、LZO压缩、Storm安装等关键步骤。适用的操作系统为Red Hat Enterprise Linux 6.2和6.4以及CentOS 6.2和6.4的64位版本,并对浏览器、硬盘空间、hosts文件配置、主机名设定、密码统一、系统优化等方面提出了具体要求。"
在CDH集群部署中,首先需要规划服务器硬件资源,确保操作系统为指定的RHEL或CentOS版本,并且至少有64GB的内存。对于存储空间,推荐最小值为/var目录20GB,/usr目录15GB,/opt目录15GB。此外,所有主机间的通信依赖于正确配置的/etc/hosts文件,需包含所有主机的IP地址和主机名。
网络配置是关键,确保每台主机的hostname与IP地址对应,并通过命令行修改主机名为指定格式。为了简化管理,手册建议在集群中统一所有服务器的密码。对于CentOS 6.3,还需要进行透明大页面(Transparent Huge Pages)的配置,以优化性能,同时关闭Selinux服务以减少安全限制。
离线安装Cloudera Manager5和CDH5是通过创建本地YUM软件源来实现的,这一过程包括设置本地类库,安装CM,配置CM使用的MySQL数据库,然后使用本地库安装CDH5组件。高可用性是通过启用HDFS的HA(High Availability)模式,基于Quorum-based Storage来实现,确保数据的安全性和服务的连续性。
CDH集群中使用LZO压缩可以提高数据处理效率,手册详细介绍了hadoop_lzo的安装,MapReduce的配置,以及在完成配置后重启相关服务以使更改生效。另外,手册还包含了安装Apache Storm的步骤,Storm是一个实时计算框架,能增强集群的实时处理能力。
附录部分记录了CDH安装部署过程中可能遇到的问题及其解决方案,帮助用户在实际操作中解决可能出现的困难。
这份CDH集群部署手册提供了全面的指导,涵盖了从基础环境准备到复杂服务配置的整个流程,对进行CDH集群部署的专业人士来说是宝贵的参考资料。
170 浏览量
1145 浏览量
119 浏览量
504 浏览量
170 浏览量
135 浏览量
1953 浏览量
1145 浏览量
119 浏览量
chenxf10
- 粉丝: 3
- 资源: 18
最新资源
- jungle-rails:丛林项目
- piazza-api:Piazza内部API的非官方客户端
- hadoopstu.7z
- 2014学校德育工作年度计划
- matlab的slam代码-openslam_cekfslam:来自OpenSLAM.org的cekfslam存储库
- Zendi-crx插件
- svg.path:SVG路径对象和解析器
- 朱宏林.github.io
- Fivlytics - Fiverr Seller Assistant-crx插件
- 基于代码变更分析的过时需求识别
- tomcat windwos 7\8
- Hot-Restaurant-App
- VB.net 2010 读写txt文件
- pcdoctor
- java版sm4源码-spring-security-family:关于如何在微服务系统中使用spring-security的demo&分享
- iiam:IIAM App正在开发中!