sparksql写入hdfs动态分区(spark继承了什么分布式的优点)

技术Spark的集群deploy模式有哪些这篇文章主要介绍“Spark的集群deploy模式有哪些”,在日常操作中,相信很多人在Spark的集群deploy模式有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操

本文主要介绍“什么是Spark的集群部署模式”。在日常操作中,相信很多人对Spark的集群部署模式存在哪些问题有所怀疑。边肖查阅了各种资料,整理出简单易用的操作方法,希望能帮助大家解答“Spark的集群部署模式有哪些”的疑惑!接下来,请和边肖一起学习!

Spark有三种集群部署模式,即集群管理模式。它们是独立的,纱和介子。这三种模式实际上是主/从模式。

Spark的集群deploy模式有哪些

三种集群资源管理概述

Spark的集群deploy模式有哪些

Spark Standalone

作为Spark的一部分,Standalone是一个简单的集群管理器。它具有对工作人员故障灵活响应的高可用性、管理每个应用程序资源的能力,以及与现有Hadoop一起运行和访问HDFS数据的能力。该版本包括一些可以在本地或AmazonEC2云计算中轻松部署的脚本。它可以在Linux、Windows或Mac OSX上运行.

Apache Mesos

Apache Mesos,分布式系统内核,带HA的主从,可以管理各个应用的资源,对Docker容器有很好的支持。它可以运行Spark work、Hadoop的MapReduce或任何其他服务应用程序。它有Java、Python和C语言的API。它可以在Linux或Mac OSX上运行.

Hadoop YARN

Hadoop YARN是一个用于作业调度和集群资源管理的分布式计算框架,以HA为主、从,支持不安全模式下的Docker容器、安全模式下的Linux和Windows容器执行器以及可插拔调度器。它可以在Linux和Windows上运行。

集群资源调度能力的对比

模式资源调度能力比对SecurityHA

独立仅支持先进先出调度器,单用户串行。默认情况下,应用程序可以使用所有节点的所有资源。节点节点和cpu内存的限制可以通过SparkConf控制共享秘密的单点恢复,SSL为数据加密备用主控与zookeeper和本地文件系统。

纱支持资源调度器和应用程序管理器应用程序管理器。CapacityScheduler和FairScheduler在队列范围内,资源是共享的。Kerberos .用于SSL数据加密的主动/备用切换的HA模式取决于zookeeper,但不需要单独的zkfc进程。

Mesos看下面:插件安全模块,默认赛勒斯SASL,SSL进行数据加密一主多备,领袖选举基于zookeeper。

Mesos的资源调度能力描述

粗粒度模式:每个应用的运行环境由一个Dirver和几个executor组成,其中每个executor占用几个资源,可以在内部运行多个Task(对应多少槽)。在应用程序的每一个任务正式运行之前,都需要申请运行环境中的所有资源,这些资源在运行过程中应该始终被占用,即使不被使用,* * *程序运行后,这些资源应该被回收。比如你提交一个应用,你指定用5个执行器来运行你的应用,每个执行器占用5GB内存和5个CPU,每个执行器内部设置了5个槽,所以Mesos需要为执行器分配资源,先启动它们,然后开始调度任务。另外,在程序运行过程中,mesos的主从并不知道执行器内部各个任务的运行状态,执行器通过内部通信机制直接向Driver报告任务状态。在某种程度上,可以认为每个应用程序都使用mesos来构建一个虚拟集群供自己使用。

细粒度模式:鉴于粗粒度模式会浪费大量资源,Spark On Mesos还提供了另一种调度模式:细粒度模式,类似于现在的云计算,思路是按需分配。与粗粒度模式一样,当应用程序启动时,执行器将首先启动,但每个执行器占用的资源只是其自身操作所需的资源,无需考虑将来要运行的Tasks。之后,mesos会为每个执行器动态分配资源,每次分配后可以运行一个新的任务,单个任务完成后可以立即释放相应的资源。每个任务将向Mesos从机和Mesos主机报告状态,这有利于更细粒度的管理和容错。这种调度模式类似于MapReduce调度模式,每个Task都是完全独立的。优点是便于资源控制和隔离,缺点也很明显,短作业长延迟运行。

至此,“Spark有哪些集群部署模式”的研究结束,希望能解决大家的疑惑。理论和实践的结合可以帮助你学得更好。去试试吧!如果你想继续学习更多的相关知识,请继续关注网站,边肖会继续努力,给大家带来更多实用的文章!

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/145794.html

(0)

相关推荐

  • 跨境电商租用美国服务器有必要吗

    技术跨境电商租用美国服务器有必要吗对于跨境电商来说随着您的业务增长,您应该关心最重要的一件事是您的网站服务器能够承载更多并发。这里美国服务器在市场上一向以高性价比和强大性能享有盛誉,因此成为很多跨境电商用户搭建商城平台的

    礼包 2021年12月14日
  • 解决texlive化学式转换镜像经常偶发性进程堆积导致卡顿问题

    技术解决texlive化学式转换镜像经常偶发性进程堆积导致卡顿问题 解决texlive化学式转换镜像经常偶发性进程堆积导致卡顿问题前言
    之前在 使用Python定时清理运行超时的pdflatex僵尸进程

    礼包 2021年12月2日
  • Kubernetes04

    技术Kubernetes04 Kubernetes04 - 从容器到云原生
    容器到云原生的路线:
    容器 - Kubernetes - 微服务 -云原生 - 服务网格 - 使用场景 - 开源。
    为什么使用

    礼包 2021年11月12日
  • MYSQL 8 Innodb cluster mysqlsh安装详细过程及周边是怎样的

    技术MYSQL 8 Innodb cluster mysqlsh安装详细过程及周边是怎样的今天就跟大家聊聊有关MYSQL 8 Innodb cluster mysqlsh安装详细过程及周边是怎样的,可能很多人都不太了

    攻略 2021年10月25日
  • Java并发编程相关概念及注意事项是什么

    技术Java并发编程相关概念及注意事项是什么Java并发编程相关概念及注意事项是什么,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。相应的概念

    攻略 2021年10月23日
  • linux下怎么安装mysql

    技术linux下怎么安装mysql这篇文章主要介绍linux下怎么安装mysql,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!1、sudo apt-get install g++ gcc make

    攻略 2021年10月21日