SparkCore分布式部署解析：Standalone、YARN、Mesos

5星 · 超过95%的资源需积分: 24 22 浏览量更新于2024-07-21 4 收藏 6.99MB DOCX 举报

SparkCore源码阅读，主要涵盖了Spark的三种部署方式：Standalone、YARN和Mesos。本文档特别指出，Standalone模式是Spark的基础部署模式，无需依赖其他资源管理系统，具有完整的服务架构。在深入源码之前，首先了解Spark的部署方式是至关重要的。Standalone模式作为独立部署，其特点是自带所有必需的服务，可以在一个集群中单独运行。由于它不依赖任何外部资源管理系统，因此简化了部署和运维。然而，Standalone模式也并非无懈可击，最初它存在Master节点的单点故障问题。这个问题通过引入Zookeeper得以解决，类似于HBase Master的高可用性方案。对比Spark Standalone和MapReduce，两者都包含Master/Slaves架构，并且都曾面临Master的单点故障问题。不过，Apache MRv1的JobTracker在CDH版本中已经解决了这个问题。在资源抽象方面，两者都使用slot来表示节点资源，但MapReduce将slot分为map和reduce两类，限制了Task的共享，降低了资源利用率。相反，Spark的slot不分类型，所有Task都能共享，提高了资源利用效率，但牺牲了针对不同Task的定制化能力。对于YARN和Mesos这两种部署方式，Spark则作为一个计算框架运行在通用的资源管理系统之上，这有助于降低运维成本并优化资源利用率。YARN和Mesos提供了更高级别的资源管理和容错性，使得Spark可以与其他计算框架共用集群资源。在源码阅读的过程中，Standalone模式是一个好的起点，因为它相对简单，没有额外的资源管理层复杂性。通过理解Standalone模式的实现，开发者可以更好地把握Spark的整体架构和核心机制，为进一步研究YARN和Mesos模式的源码打下基础。 SparkCore是Spark的核心组件，负责任务调度、内存管理、故障恢复以及与存储系统的交互。源码阅读可以帮助开发者深入理解Spark的工作原理，包括RDD（弹性分布式数据集）的生命周期、DAG（有向无环图）的构建、Stage划分以及Task调度等关键概念。此外，源码分析还能揭示Spark如何高效地处理数据，如内存管理中的Tungsten项目，以及如何通过Shuffle优化数据交换。 SparkCore源码阅读对于想要深入了解Spark的开发者来说是一项有价值的实践，特别是对于那些希望优化性能或实现自定义功能的工程师。通过掌握Spark的内部工作机制，开发者能够更好地应对大数据处理的挑战，提升应用的性能和效率。

<else 9

47*48s"Got heartbeat from unregistered worker $:." ;

" This worker was never registered, so ignoring the heartbeat.""

<

<

<

case ,/"$%"8:"AD9

+--48:"match 9

case 8"AD

4:68"Application has been re-registered: " ;:"

A***+9

case AD

47*48"Master change ack from unknown app: " ;:"

<

if 8%"98"<

<

case *$#-8:=-=*:"AD9

+*$48:"match 9

case 8"AD

4:68"Worker has been re-registered: " ;:"

A7

val *,-A-J8-AD+--48-:"*&J"

for 8-L3*,-"9

val A+--48-:"4

val -:6A,-8=-=8--:""

,-8-:6"

-:68-"

<

for 8*:L3*:"9

J8C*AA*:"69*AD

*%$A8"

*A&*9

8*:"A*

<

<

case AD

47*48"Scheduler state from unknown worker: " ;:"

<

if 8%"98"<

<

case "--8**:"AD

4:68s"Received unregister request from application $**:""

+--48**:"68J***"

case 18C==C"AD9

+#!)%$--B%%

4:68s"$ got disassociated, removing it.""

+*$48"687"

+--48"68J***"

if 8AA/9II%"98"<

<

case NAD9

H,-8

==:#=

%$=--=---=

=-1="

<

case %B7$*(AD9

*(&78"

<

case 01NAD9

H:#-8=%)!1=:#"

<

当  启动完毕之后，主要在等待  注册上来。接下来看  如何注册上来，首先看下  进程的参数：

4,3&",R3>3>

?"?4"?+?'?+  9  >?"?4"?+?'>?"?4"?+?'?+>>?"?4"??"'?4'993.9

4+>?"?4"?99'94?'??$>?"?4"?99'94?'?9%')99

43+>?"?4"?99'94?'?""99+9,+>?"?4"?99'94?'?

""993+>?"?4"?99'94?'?""9'%9+>?"?4"?4??4  9

SS>8%T7.%  9))7UHH:!!8!  9

)T"71>.V1>.V1(>.  9)T7?  9

*<$)!7"9S%(%9S%(%*4)@>??1999>1311

2. Work 的启动

接着看下  类

private>@class 78

5*4=

5:=

!2*15:=

5:=

5:=

25>*4@=

5*4=

5*4=

&*15*4Anull=

val 65%6=

val *45*4"

extends with ?4*with ?44*49

它也是一个 ，其必定也会先执行  的  钩子函数：

override def 8"9

8H""

4:68"Starting Spark worker %s:%d with %d cores, %s RAM"68

===2*") +"8"""

4:68s"Running Spark version $94<""

4:68"Spark home: " ;-$A"

7&*8"

(!*!8=>*4?*6,@"

#C:6,!8"

%)Anew 77!2:8this=%$1=!2*1"

%)!*8"



开始注册

,

4*7*8"

 4*8%$#"

 8"

%$%)# .

 4 68%) "

接下来主要看下 *4 的逻辑：

private def 4*7*8"9

1 )""#-!-"

#""-#.

" +match 9

case AD

"Afalse

4*8"

-/#A

" +A9

(8+9+++0+=

+9+++0+==4*7*"

开启短定时器向其自己发送

"*,

<

剩余63页未读，继续阅读

亮亮-AC米兰

粉丝: 232
资源: 8

SparkCore分布式部署解析：Standalone、YARN、Mesos

spark-core_2.11-1.6.0.jar

spark源码以及官方的示例（方便阅读源码学习）

Spark缺少的jar包

spark core源码

spark源代码怎么看能更好的了解spark

如何学习spark源码？

spark-core源码学习记录 2 应用提交submit 及driver注册流程，以javawordcount为例

简述Spark四大组件

sparksql底层执行的原理详解(面试必备)

找不到此对象的源代码: org.apache.spark:spark-sql_2.13:3.3.1

最新资源