Spark中的Driver和Executor的个人理解

Spark中的Driver和Executor的个人理解Driver Driver 是 Spark 中 Application 也即代码的发布程序 可以理解为我们编写 spark 代码的主程序 因此只有一个 负责对 spark 中 SparkContext 对象进行创建 其中 SparkContext 对象负责创建 Spark 中的 RDD Spark 中的基本数据结构

大家好,我是讯享网,很高兴认识大家。

在这里插入图片描述
讯享网
Driver:Driver是Spark中Application也即代码的发布程序,可以理解为我们编写spark代码的主程序,因此只有一个,负责对spark中SparkContext对象进行创建,其中SparkContext对象负责创建Spark中的RDD(Spark中的基本数据结构,是一种抽象的逻辑概念)
Driver的另外一个职责是将任务分配给各个Executor进行执行。任务分配的原则主要是就近原则,即数据在哪个Executor所在的机器上,则任务分发给哪个Exectuor。
简单来说就是:Driver就是new sparkcontext的那个应用程序类可以成为Driver ,而且Driver的职责是将任务分配给Exectuor执行计算

Executor:是Spark中执行任务的计算资源,可以理解为分布式的CPU,每台机器可能存在多个Executor(因为计算机的CPU有多个核),这些分布式的计算机集群会有很多的Executor,Executor主要负责Spark中的各种算子的实际计算(如map等)

小讯
上一篇 2025-03-13 11:30
下一篇 2025-01-08 13:49

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/129476.html