CDH集群部署详解:从空机到高可用Hadoop环境
4星 · 超过85%的资源 需积分: 10 107 浏览量
更新于2024-07-21
1
收藏 995KB DOCX 举报
本文档是一份详尽的Cloudera Hadoop集群部署手册,针对从零开始建立高可用性CDH(Cloudera Distribution for Hadoop)集群的步骤进行了详细的指导。这份文档特别关注于在几台空机器上部署CDH服务器端和Cloudera Manager web端的整个过程,确保了系统的安全性和性能优化。
**一、CDH服务器端部署**
1. **开启root权限**
在每个节点上,通过编辑`/etc/ssh/sshd_config`文件,取消注释并启用root远程登录,确保`PermitRootLogin`设置为`yes`,然后重启sshd服务,但需注意这可能带来潜在风险。
2. **设置主机名**
修改每个节点的`/etc/sysconfig/network`文件,将默认主机名替换为实际的节点名称,如`cdh1`、`cdh2`和`cdh3`。设置完成后,用`hostname`命令验证更改。
3. **设置host解析**
编辑`/etc/hosts`文件,确保主机名与IP地址对应,以便在系统内部进行域名解析。
4. **时间同步**
确保所有节点时间同步,这对于Hadoop集群的正确运行至关重要,可以使用NTP服务来实现。
5. **防火墙和SELinux管理**
关闭防火墙以允许必要的网络通信,并确保SELinux处于关闭状态,以免影响Hadoop的服务运行。
6. **启动必要服务和调整参数**
启动Hadoop相关服务,例如YARN和HDFS,同时关闭不必要的服务如hugepages,并调整内存参数以提高性能。
7. **SSH免密登录**
设置SSH免密登录,方便后续的运维操作。
8. **离线安装CDH**
下载离线版本的CDH安装包,通常从Cloudera官方网站获取。
9. **上传并安装离线包**
将离线包上传到服务器,并按照文档指导安装。
10. **配置yum源**
设置CDH的yum源,确保后续软件更新的可靠性。
11. **部署CDH离线包和parcel源包**
安装离线包和 parcel,这是构建复杂Hadoop生态系统的重要步骤。
12. **停用postgresql服务**
在某些场景下,可能需要暂停数据库服务以避免冲突。
13. **运行CDH安装向导**
运行CDH的安装向导,完成集群的配置和初始化。
**二、ClouderaManager web端部署**
1. **部署节点**
在Cloudera Manager中添加和配置各个Hadoop节点,包括节点类型和角色配置。
2. **部署集群服务**
使用Cloudera Manager图形界面配置Hadoop组件(如HDFS、YARN、Hive等),以及安全设置和监控配置。
总结来说,这份文档提供了一套全面的指南,涵盖了从基础环境准备到高级配置的每一个关键步骤,适合IT专业人员或对Hadoop有兴趣的学习者用来搭建和管理高效的CDH集群。通过遵循这些步骤,用户可以确保集群的稳定性和可扩展性,从而为大数据处理提供强大的支持。
2019-11-29 上传
2018-10-23 上传
2015-10-29 上传
2021-08-13 上传
2020-12-02 上传
qq910559287
- 粉丝: 0
- 资源: 1
最新资源
- ERP服务运输
- matlab模拟poisson过程源码-jburkardt-f:JohnBurkardt的大量FORTRAN90软件的官方Git镜像
- seml:SEML
- 全果压榨常山胡柚浓缩汁的加工
- cv
- 三角兽-如何消除机器人对人类的误解.rar
- 华为_硬件工程师手册(全).zip-综合文档
- web-cli:在您的网络上掌握您的命令行
- Harvard_CS50_AI_Course_Project2b_Heredity
- JavaScript基础
- AE音频可视化40.zipae轨道音频可视化模板文件,专门用于制作二次元音乐播放视频 视频剪辑必备 压缩文件解压即可,winal
- rsapi-wrapper:它只是用于随机填充API的包装器
- Google Chrome.zip
- web:我的第一个网页
- KLE-Render:将原始代码从Keyboard-Layout-Editor.com转换为OBJMTL格式以进行渲染的工具
- jhelpdev-开源