用户在client端提交作业后,会由Driver运行main方法并创建spark context上下文。
执行add算子,形成dag图输入dagscheduler,按照rdd之间的依赖关系划分stage输入task scheduler。 taskscheduler会将stage划分为task set分发到各个节点的executor中执行。

用户在client端提交作业后,会由Driver运行main方法并创建spark context上下文。
执行add算子,形成dag图输入dagscheduler,按照rdd之间的依赖关系划分stage输入task scheduler。 taskscheduler会将stage划分为task set分发到各个节点的executor中执行。