Spark 1.2.1 集群部署与运行：Standalone与YARN模式

5星 · 超过95%的资源需积分: 9 143 浏览量更新于2024-09-11 收藏 89KB DOCX 举报

"本文主要介绍了Spark 1.2.1版本在独立（standalone）集群模式和YARN集群模式下的部署与运行方法，包括如何运行示例应用和启动Spark Shell。此外，还提及了Spark的不同运行模式，如本地模式、伪分布式模式以及standalone、Mesos和YARN上的分布式部署。" 在Spark 1.2.1中，部署和运行应用涉及到多个关键步骤。首先，确保环境已配置妥当，例如在Linux系统中设置无密码SSH登录。针对`onyarn`模式，需要安装Hadoop 2.6.0并正确配置其环境。运行示例应用是验证安装是否成功的好方法。通过`bin/run-example`命令可以运行内置的Spark示例。例如，`./bin/run-example SparkPi 10`将执行计算圆周率的Spark Pi程序，而`./bin/run-example org.apache.spark.examples.SparkPi 4`则是另一种调用方式。 Spark Shell是用于交互式测试和开发的工具，它提供了一个Scala REPL环境。用户可以输入`./bin/spark-shell --master local[2]`启动一个包含2个工作线程的本地Shell，或者通过指定`MASTER`环境变量为`local`来运行。在Shell中，可以编写和执行Scala代码，如读取HDFS上的文件，进行数据处理，然后收集结果。例如，读取文本文件，计算单词计数，最后输出结果。 Spark的运行模式多样，包括单机模式（本地模式和伪分布式）以及集群模式。在集群模式下，Spark支持三种部署方式：Standalone、Spark on Mesos以及Spark on YARN。Standalone模式是Spark自带的集群管理器，Mesos和YARN则提供了跨不同框架的资源调度。启动Standalone集群可以手动进行，若无`conf/spark-env.sh`配置文件，会使用默认设置启动Master节点。 Spark 1.2.1的部署和运行涉及环境配置、选择合适的运行模式以及理解不同部署策略。正确理解和操作这些步骤对于在生产环境中高效使用Spark至关重要。

说明

  版本为：已经做了相应的环境配置，比如  的免鉴

权登录等。

 在 模式下，已经安装  并正确配置。

Running the Examples and Shell

bin/run-example:运行 spark 提供的例子，仅指定 Local 模式。





：采用交互方式运行  应用。执行后，进入  模式。

!"#$%# $

&

&'(#

!"#$%")*+,-

&

&'(#

scala> val file = sc.textFile("hdfs://192.168.2.200:9000/tmp/test.txt")

scala> val count = file.flatMap(line => line.split(" ")).map(word => (word,

1)).reduceByKey(_+_)

scala> count.collect()

下载后可阅读完整内容，剩余7页未读，立即下载

flchess

粉丝: 0
资源: 3

Spark 1.2.1 集群部署与运行：Standalone与YARN模式

Spark on Yarn模式部署.docx

Spark独立部署模式

Spark环境搭建与Scala开发详解

【中国房地产业协会-2024研报】2024年第三季度房地产开发企业信用状况报告.pdf

【中国银行-2024研报】美国大选结果对我国芯片产业发展的影响和应对建议.pdf

RM1135开卡工具B17A

毕业设计&课设_宿舍管理系统：计算机毕业设计项目.zip

毕业设计&课设_画手交易管理系统：Java 毕设项目.zip

跑腿平台系统 微信小程序+SSM毕业设计 源码+数据库+论文+启动教程.zip

Visual Studio 2013 Shell

最新资源

跑腿平台系统微信小程序+SSM毕业设计源码+数据库+论文+启动教程.zip