Spark官方文档深度解析：Nimbus与Supervisor架构与消息传递机制

需积分: 30 124 浏览量更新于2024-07-19 收藏 424KB PDF 举报

Spark官方文档深入解析 Spark是一个开源的大数据处理框架，由Apache软件基金会维护，以其高效、容错和可扩展性而闻名。这份文档详细探讨了Spark的启动过程、核心组件的工作原理以及消息传递机制。以下是主要内容概览： 1. 启动场景分析： - Nimbus是Spark的主节点，负责管理和调度topology（任务图）。它首先从配置文件读取信息，包括配置文件内容，如Thrift服务的设置，以及与Zookeeper的交互。 - Supervisor是运行在每个节点上的进程，负责管理worker（工作进程），包括启动和监控工作进程，以及与Nimbus的同步。 2. Topology提交过程： - StormBuilder是构建拓扑的核心类，用户通过`setSpout`和`setBolt`方法定义spout（源头）和bolt（处理器），然后调用`createTopology`生成实际的topology对象。 - `stormclient`负责与Nimbus进行交互，提交topology，包括`submitTopologyWithOpts`方法，其中包含了顶点分配策略的规范化。 3. Message Passing： - 基于Disruptor的数据结构，Spark的消息传递机制高效且低延迟。Worker接收线程通过socket接收tuple（逻辑单元），Disruptor确保线程安全地在接收、处理和发送之间切换。 - Tuple发送涉及`IConnection`接口和grouping策略，这些用于决定tuple如何在拓扑中的不同bolt间流转，保证可靠性。 4. Worker进程中的关键组件： - 存在多个线程，如接收和发送线程，负责与Supervisor和Nimbus通信；Zkclient用于Zookeeper交互；定时器线程用于执行定时任务；SystemBolt和MetricsBolt是特殊类型的bolt，前者用于系统操作，后者收集性能指标。 5. 可靠性保障： Spark的设计注重处理大规模数据的容错性和可靠性。消息传递机制通过重试、确认机制以及心跳检测来确保数据不丢失，并在出现故障时能够快速恢复。总结，这份文档深入探讨了Spark启动过程中的关键节点、拓扑构建和提交、以及消息传递的底层实现，帮助读者理解Spark的内部工作机制，以便更好地进行开发和运维。通过理解这些细节，开发者可以更有效地利用Spark处理大规模数据处理任务。

2.4 zookeeper

在上节中讲到了 service-handler, 此函数在开头处就是要建立与zookeep-

erserver之间的通讯，不过代码写的很隐蔽。

zookeeper提供的原生java api用于实际场景中对于开发者要求很高，为了

减少开发周期，storm中使用了curator来与zookeeper server进行交互。

zookeeper.clj中的mk-client函数就是初始化Curator即建立与zookeeper

server的连接。

(defnk mk-client [conf servers port :root "" :watcher default-watcher :auth-conf nil]

(let [fk (Utils/newCurator conf servers port root (when auth-conf (ZookeeperAuthInfo. auth-conf)))]

(.. fk

(getCuratorListenable)

(addListener

(reify CuratorListener

(^void eventReceived [this ^CuratorFramework _fk ^CuratorEvent e]

(when (= (.getType e) CuratorEventType/WATCHED)

(let [^WatchedEvent event (.getWatchedEvent e)]

(watcher (zk-keeper-states (.getState event))

(zk-event-types (.getType event))

(.getPath event))))))))

(.start fk)

fk))

nimbus中的service-handler是如何与zk/mk-client建立联系的呢，其调用

关系如下图所示。

service-handler

nimbus-data

mk-storm-cluster-state

mk-distributed-cluster-state

zk/mk-client

Figure 2: call tree for mk-client

需要注意的是，nimbus中并没有注册任何回调函数来处理zookeeper送来的

notification。nimbus是通过定时机制来定期轮询zookeeper中的目录进而感知

到supervisor的加入和退出。

(defprotocol StormClusterState

(assignments [this callback])

(assignment-info [this storm-id callback])

(active-storms [this])

(storm-base [this storm-id callback])

(get-worker-heartbeat [this storm-id node port])

(executor-beats [this storm-id executor->node+port])

(supervisors [this callback])

(supervisor-info [this supervisor-id]) ;; returns nil if doesn't exist

剩余58页未读，继续阅读

应该是林冬

粉丝: 31
资源: 15

Spark官方文档深度解析：Nimbus与Supervisor架构与消息传递机制

spark官方文档中文版.pdf

spark官方文档中文版

Spark官方文档中文翻译

spark java教程_《Spark 官方文档》Spark快速入门

spark好友推荐java

高性能spark pdf

spark源代码怎么看能更好的了解spark

Spark 阿里云部署

spark tfidf

linux spark安装

最新资源