spark运行机制

技术spark运行机制 spark运行机制构建DAG(Driver 端完成)
使用算子操作 RDD 进行各种 Transformation 操作,最后通过 Action 操作触发 Spark 作业运行。

火花操作机构

构建DAG(驱动程序结束已完成)

操作员操作RDD用于执行各种转换操作,最后触发火花作业运行操作。提交后,Spark会根据转换过程中生成的rdd之间的依赖关系,构建一个有向无环图。

达格切割(在驱动端完成)

DAG切割主要解决根据RDD是否依赖宽度切割节点的问题,遇到宽依赖时将任务划分到新的调度阶段。每个阶段包含一个或多个任务。这些任务将形成一个任务集,该任务集将提交给底层调度程序进行调度和运行。

任务调度(驱动端完成)

每个火花任务计划程序只为一个火花上下文实例服务。任务调度器收到任务集后,负责将任务集分发到Worker节点的Executor进程,以任务任务的形式执行。如果任务失败,任务计划程序负责重新分配任务的计算。

执行任务(由工作人员的执行者执行)。

执行器收到发送的任务后,会以多线程方式执行任务计算(执行器重启时会初始化一个线程池),每个线程负责一个任务。任务完成后,它会根据任务的类型选择相应的返回模式,并将结果返回给任务调度器。

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/61495.html

(0)

相关推荐

  • windows php 命令(php环境搭建的主要步骤和方法)

    技术然后使用在Homestead中版本管理工具切换 PHP 版本然后使用在Homestead中版本管理工具切换 PHP 版本,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能

    攻略 2021年12月23日
  • maven如何打包zip包含bin下启动脚本

    技术maven如何打包zip包含bin下启动脚本这篇文章主要为大家展示了“maven如何打包zip包含bin下启动脚本”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“maven

    攻略 2021年10月31日
  • Kafka Producer重试参数retries设置取舍的示例分析

    技术Kafka Producer重试参数retries设置取舍的示例分析Kafka Producer重试参数retries设置取舍的示例分析,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有

    攻略 2021年11月17日
  • 英文mv100首

    技术英文mv100首 英文mv100首用Raysource下载 CD1(1-20):fs2you://Y2FjaGVmaWxlMTgucmF5ZmlsZS5jb20vemgtY24vZG93bmxvYW

    礼包 2021年11月19日
  • 如何进行SpringBoot开发环境热部署的配置

    技术如何进行SpringBoot开发环境热部署的配置如何进行SpringBoot开发环境热部署的配置,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。在实际

    攻略 2021年11月18日
  • 如何进行JS中的事件冒泡与捕获

    技术如何进行JS中的事件冒泡与捕获这期内容当中小编将会给大家带来有关如何进行JS中的事件冒泡与捕获,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。刚接触 JS 的那个时候,啥也不懂,只想

    攻略 2021年11月16日