简述spark的运行架构(spark可以运行在哪些模式下)

技术如何解析Spark运行模式这篇文章将为大家详细讲解有关如何解析Spark运行模式,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。Spark运行模式1 Spark的两个

本文将详细说明如何分析Spark的运营模式。这篇文章的内容质量很高,所以边肖会分享给大家作为参考。希望你看完这篇文章后有所了解。

Spark运行模式

1 Spark的两个重要角色

1.1 简介

Spark是一个基于内存的快速、通用、可扩展的大数据分析引擎。

1.2 spark内置模块:

如何解析Spark运行模式

1.3 Spark的两个重要角色:

Driver(驱动器)负责管理调度任务。

:负责具体任务。

如何解析Spark运行模式

2 Spark运行模式

本地模式:它在机器上运行,通常在动手或测试环境中运行。

Standalone:基于Mster从机构建资源调度集群,将Spark任务提交给Master运行。Executor(执行器).

Spark :星火客户端直接连接纱线和自身的一个调度系统,不依赖Yarn等其他框架,Yarn,不需要额外构建 .有两种模式,纱线客户端和纱线集群。主要区别是:Spark .

纱线客户端:驱动程序运行在客户端,适合交互和调试。希望马上看到app的输出。

纱簇:驱动程序运行在由资源管理器启动的应用程序中,适用于生产环境。

Mesos:家庭环境很少使用。

几种模式的比较:

如何解析Spark运行模式

3 Local模式(下的WordCount)

集群

如何解析Spark运行模式

如何解析Spark运行模式

Driver 程序的运行节点加载文件

3.1 Spark-Wordcount基本思路:把句子一个接一个地分成单词;

文件加载load::把同样的单词放在一组中;

扁平化:计算每个小组的成员人数;

(以上过程是左图的简化过程,不太准确。按照以下步骤记住它;正确的图片是准确的过程)

分组

如何解析Spark运行模式

聚合

3.2 Wordcount代码实现:曾经加载文件;

相关方法说明::用于扁平化和分词;

TextFile:把每个单词映射到一个祖先;

根据关键字进行FlatMap:分组和聚合;

如何解析Spark运行模式

Map

如何解析Spark运行模式

4 Yarn模式(重点)

ReduceByKey

Spark客户端直接连接到Yarn,不需要额外构建Spark集群。有两种模式,纱线客户端和纱线集群。主要区别在于驱动程序的运行节点。

纱线客户端:驱动程序运行在客户端,适合交互和调试。希望马上看到app的输出。

纱簇:驱动程序运行在由资源管理器启动的应用程序中,适用于生产环境。

3.3 Wordcount过程图示

4.1 概述

如何解析Spark运行模式

如何解析Spark运行模式

一起看两张图片。

5 Standalone模式(独立部署模式)

4.2 Yarn运行模式(重点)

要清晰知道每一步的过程。

构建一个由主从节点组成的Spark集群,Spark在集群中运行。

就是只用spark自己的东西,不用Yarn等其他的框架。

如何解析Spark运行模式

Master相当于纱线中的RM;

工人相当于纱线中的纳米;

如何分析Spark的运营模式就分享到这里了,希望。

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/149258.html

(0)

相关推荐

  • 为所当为,如何理解王维的《送别》

    技术为所当为,如何理解王维的《送别》唐代诗人为所当为、画家有“诗佛”之称的王维,字摩诘,号摩诘居士。河东蒲州人(山西运城),祖籍太原祁州人(太原祁县)历任官职甚多,后官至尚书右丞,故称王右丞。《送别》唐代: 王维下马饮君

    生活 2021年10月28日
  • ARCHIVELOG如何统计归档日志更准确

    技术ARCHIVELOG如何统计归档日志更准确小编给大家分享一下ARCHIVELOG如何统计归档日志更准确,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了

    攻略 2021年12月10日
  • 什么是python尾递归

    技术什么是python尾递归本篇内容主要讲解“什么是python尾递归”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“什么是python尾递归”吧!递归是啥?递归函数大家肯定写

    攻略 2021年11月2日
  • 24 二级视图

    技术24 二级视图 24 二级视图和一级视图相比:GenericAPIView来自 :from rest_framework.generics import GenericAPIView新增:字段:  

    礼包 2021年11月4日
  • OpenCV识别人脸的源码怎么编写

    技术OpenCV识别人脸的源码怎么编写这篇文章主要介绍“OpenCV识别人脸的源码怎么编写”,在日常操作中,相信很多人在OpenCV识别人脸的源码怎么编写问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望

    攻略 2021年11月29日
  • MySQL基础常见问题集锦

    技术MySQL基础常见问题集锦 MySQL基础常见问题集锦sql中设置主键中一般规则/不能对部分使用 `distinct` 关键字/SQL客户端写存储过程时, 需要用 `DELIMITER ` 命令设置

    礼包 2021年11月23日