spark运行机制

技术spark运行机制 spark运行机制构建DAG(Driver 端完成)
使用算子操作 RDD 进行各种 Transformation 操作,最后通过 Action 操作触发 Spark 作业运行。

火花操作机构

构建DAG(驱动程序结束已完成)

操作员操作RDD用于执行各种转换操作,最后触发火花作业运行操作。提交后,Spark会根据转换过程中生成的rdd之间的依赖关系,构建一个有向无环图。

达格切割(在驱动端完成)

DAG切割主要解决根据RDD是否依赖宽度切割节点的问题,遇到宽依赖时将任务划分到新的调度阶段。每个阶段包含一个或多个任务。这些任务将形成一个任务集,该任务集将提交给底层调度程序进行调度和运行。

任务调度(驱动端完成)

每个火花任务计划程序只为一个火花上下文实例服务。任务调度器收到任务集后,负责将任务集分发到Worker节点的Executor进程,以任务任务的形式执行。如果任务失败,任务计划程序负责重新分配任务的计算。

执行任务(由工作人员的执行者执行)。

执行器收到发送的任务后,会以多线程方式执行任务计算(执行器重启时会初始化一个线程池),每个线程负责一个任务。任务完成后,它会根据任务的类型选择相应的返回模式,并将结果返回给任务调度器。

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/61495.html

(0)

相关推荐

  • 5肖臻区块链听课笔记

    技术5肖臻区块链听课笔记 5肖臻区块链_听课笔记去中心化升级小部分未升级,产生协议分叉,协议升级,新旧互相不合法,产生hard fork,只要旧的不更新,分叉一直有soft fork临时的,旧结点只能去

    礼包 2021年12月10日
  • 草房子主要内容50字,草房子第七章主要内容50字

    技术草房子主要内容50字,草房子第七章主要内容50字《草房子》第七章主要内容主要讲的是白雀离开蒋一轮后草房子主要内容50字,蒋一轮的心情和脾气越来越坏,经常批评同学。当班上有一个叫戚小罐的学生不遵守课堂纪律,还不停的听他

    生活 2021年10月24日
  • 对我影响最大的人,对我影响最大的人妈妈作文

    技术对我影响最大的人,对我影响最大的人妈妈作文她可以不知道我的名字对我影响最大的人,不知道我的性格,甚至不必认识我,不必了解我,就可以爱我爱得那样刻骨铭心。 是的,她就是我的妈妈。是她给了我第一份最纯洁最美丽的爱。

    生活 2021年10月27日
  • 数据结构index是什么(数据库索引可以用hash实现吗)

    技术数据库中plan_hash_value有什么用这篇文章给大家分享的是有关数据库中plan_hash_value有什么用的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

    攻略 2021年12月13日
  • ORC在Hive中如何应用

    技术ORC在Hive中如何应用这篇文章主要介绍了ORC在Hive中如何应用,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。ORC文件不仅仅是一种列式文件存储

    攻略 2021年12月11日
  • 分析Oracle RAC集群

    技术分析Oracle RAC集群这篇文章主要讲解了“分析Oracle RAC集群”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“分析Oracle RAC集群”吧!一、什么是

    攻略 2021年11月4日