Spark安装教程：Standalone、HA模式与YARN集成

101 浏览量更新于2024-08-30 1 收藏 300KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

Spark是一款开源的大数据处理框架，本文主要介绍了如何在不同的模式下安装Spark，包括Standalone模式、高可用模式以及基于YARN的模式。以下是各部分的主要知识点： 1. Spark的Standalone模式安装： - 安装流程分为几个步骤：首先，从官方网站下载spark-2.2.0-bin-hadoop2.7.tgz文件并将其上传至`/usr/local/spark/`，然后解压。接着，进入conf目录，确保配置文件名称添加`.sh`后缀以实现脚本执行。接下来，编辑`spark-env.sh`文件，配置master和slave节点信息，如slaves列表。将配置文件复制到其他虚拟机，并在`etc/profile`中添加环境变量。在sbin目录下修改启动命令，最后启动Spark服务，并通过检查JPS命令确认进程数量。 2. 检测安装成功： - 在浏览器访问Spark的WebUI（默认8080端口），确保无误。同时注意避免与Tomcat端口冲突。执行Spark程序，比如PI计算，来验证Spark是否正常运行。 3. Spark高可用模式安装： - 高可用模式需先停用Standalone模式，然后在配置文件中添加高可用相关设置，如指定worker节点。在主节点(node1)上修改slaves配置，并将配置文件复制到其他节点。启动master和worker节点分别使用`sbin/start-all.sh`和`sbin/start-master.sh`脚本。 4. Spark高可用启动及任务提交： - 在高可用模式下，启动Zookeeper以支持集群管理。通过提交任务到Spark集群，可以使用`spark-shell –master yarn-client`或`yarn-cluster`模式来测试YARN集成。运行pi计算示例，验证集群功能。 5. Spark基于YARN模式安装： - 安装流程涉及配置Hadoop环境变量，尤其是YARN-site.xml中的相关参数。通过运行jar包并在Spark Shell中使用`yarn-client`或`yarn-cluster`模式测试YARN集成。执行pi计算以确认安装正确。 6. Shell界面操作： - 不论何种模式，都能通过Spark的shell界面操作，如提交作业、查看日志和执行SQL等，这是Spark交互式开发的核心。总结，本文详细介绍了Spark在Standalone、高可用和YARN模式下的安装过程、配置要点以及测试方法，对于理解和部署Spark集群具有实际指导价值。

资源详情

资源推荐

Spark的安装（的安装（Standalone模式，高可用模式，基于模式，高可用模式，基于Yarn模式）模式）

spark的Standalone模式安装

一、安装流程

1、将spark-2.2.0-bin-hadoop2.7.tgz 上传到 /usr/local/spark/ 下，然后解压

2、进入到conf中修改名字改为 .sh 结尾的

3、编辑 spark-env.sh

4、修改slaves 的名字并且编辑他

5、发送到其他两台虚拟机上

6、修改ect/proflie下面的配置环境

7、到spark的sbin目录下修改启动命令

8、启动之后的jps数目

二、检测是否安装成功

1、进谷歌浏览器看看（端口号是8080 和tomcat端口号是一样的，注意后期一块启动的冲突问题）

2、按装完之后执行Spark程序进行迭代计算Spark上的PI示例

三、进入spark的shell界面操作算子

Spark高可用（先启动zookeeper再启动spark）

一、安装流程

二、高可用安装注意事项

1、先把Standalone模式注释掉

2、在后面添加配置注意其中的间隔

3. 在node1节点上修改slaves配置文件内容指定worker节点

4.把配置好的spark 拷贝到其他节点

5.在node1上执行sbin/start-all.sh脚本，然后在node2上执行sbin/start-master.sh启动第二个Master。

三、spark高可用启动

四、高可用模式提交任务：

Spark基于yarn调度的模式 Spark on yarn

一、Yarn集群模式安装流程：

1、需要的配置项三台都需要配

2、配置好hadoop环境变量

3.在hadoop的yarn-site中添加如下配置三台都需要配

二、通过往spark集群上运行jar包，测试安装效果，看是否安装成功

2.1、spark-shell –master yarn-client 进yarn spark shell界面的

2.2、测试基于yarn模式能否在集群上计算π

2.3、基于yarn的两种模式（client模式和cluster模式）

三、进入shell界面操作算子

spark的的Standalone模式安装模式安装

一、一、安装流程安装流程

1、将、将spark-2.2.0-bin-hadoop2.7.tgz 上传到上传到 /usr/local/spark/ 下，然后解压下，然后解压

-C 是用大写C解压到指定目录

2、进入到、进入到conf中修改名字中修改名字改为改为 .sh 结尾的结尾的

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38635449

粉丝: 5
资源: 971

Spark安装教程：Standalone、HA模式与YARN集成

spark高可用集群（自动切换方式）搭建手册

spark1.2.1常用模式部署运行

请详述Spark核心执行流程，如何使用SparkSubmit在客户端提交job后如何通过Standalone模式获取资源并执行Spark任务计算。

Spark的运行模式有那些（）

spark中standalone

spark安装需要安装zookeeper

spark worker数由什么决定

spark slot配置

Spark程序有那些进程组成（）

sparksession.builder.master

yarn build 延迟执行

driver 和 executor分别是怎么分配

val conf = new SparkConf().setAppName("test").setMaster("local[*]")，其中local[*]的意思是_____。

Spark任务调度和资源调度流程

详细阐述Spark程序执行时流程。

开发机群运维资源调度与执行算法引擎

考研复习-英语二真题考试题集-带答案

2024中美独角兽公司发展分析报告.pdf

C++ 中的异步编程模型是什么

正则表达式Regex是一种文本模式.docx

最新资源

val conf = new SparkConf().setAppName("test").setMaster("local[]")，其中local[]的意思是_____。