CM5.12.1安装Spark2.2.0 Cloudera步骤详解:附详细图文教程
需积分: 50 130 浏览量
更新于2024-09-09
收藏 783KB DOCX 举报
本文档详细介绍了如何在CM5.12.1环境中安装Spark2.2.0 Cloudera Distribution的步骤,包括了必要的系统准备以及安装过程中的一些注意事项。首先,安装前需要确保满足以下要求:
1. **Scala版本**: Spark 2.2.0需要Scala 2.11版本,不支持Scala 2.10。在安装前,请检查本地环境是否已安装正确的Scala版本。
2. **Python版本**: Cloudera提供的Spark 2.2.0支持Python 2.7或更高版本(如果是使用Python 2),以及Python 3.4或更高版本(Spark 2.1和2.2开始支持Python 3.6及以上)。
3. **JDK版本**: 必须使用JDK 8进行Spark 2.2.0的安装,因为Cloudera Distribution对Spark 2.2.0的要求是JDK 8。
接下来,开始具体的安装步骤:
**一、准备工作**
1. **下载资源**:从官方文档(<https://www.cloudera.com/documentation/spark2/latest/topics/spark2_installing.html>)获取SPARK2_ON_YARN-2.2.0.cloudera2.jar文件,并将其保存在下载目录。
2. **创建目录**:在每个CDH节点上,创建一个用于存储CSD(Cloudera Services Distribution)的目录 `/opt/cloudera/csd`。
3. **复制CSD包**:将下载的CSD包移动到指定目录,并确保修改文件权限和所有者,以确保正确执行后续操作。如果该目录下有其他jar包,可能需要清理或移动它们。
**二、安装步骤**
1. **集群管理服务调整**:在安装前,可以暂时停止集群和Cloudera Management Service,但这通常不是强制性的,只是为了简化安装过程,安装后仍需重启服务。
2. **逐节点操作**:在每个CDH节点上,执行上述创建目录、复制CSD包并修改权限的操作。
3. **执行安装**:在每个节点上,使用`scp`命令将CSD包复制到远程主机的指定目录。这里使用的命令格式是 `root@cloud`,具体执行时需要替换为实际的主机名和用户名。
通过这些步骤,您将在CM5.12.1环境中成功安装Spark2.2.0 Cloudera Distribution,之后可以根据需要启动服务并进行进一步的配置和使用。在安装过程中遇到任何问题,记得参考官方文档中的解决方案,或寻求社区技术支持。
615 浏览量
727 浏览量
441 浏览量
279 浏览量
2024-11-12 上传
566 浏览量
178 浏览量

茜vic
- 粉丝: 0
最新资源
- AVR单片机C语言编程实战教程
- MATLAB实现π/4-QDPSK调制解调技术解析
- Rust开发微控制器USB设备端实验性框架介绍
- Report Builder 12.03汉化文件使用指南
- RG100E-AA U盘启动配置文件设置指南
- ASP客户关系管理系统的联系人报表功能解析
- DSPACK2.34:Delphi7控件的测试与应用
- Maven Web工程模板 nb-parent 评测
- ld-navigation:革新Web路由的数据驱动导航组件
- Helvetica Neue字体全系列免费下载指南
- stylelint插件:强化CSS属性值规则,提升代码规范性
- 掌握HTML5 & CSS3设计与开发的关键英文指南
- 开发仿Siri中文语音助理的Android源码解析
- Excel期末考试复习与习题集
- React自定义元素工具支持增强:react-ce-ubigeo示例
- MATLAB实现FIR数字滤波器程序及MFC界面应用