sparkmllib运行原理(spark中mlli应用场景)

技术Spark中MLlib和ML库的区别是什么这篇文章给大家介绍Spark中MLlib和ML库的区别是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。机器学习库(MLlib)MLlib是Spark

本文介绍了Spark中MLlib和ML库的区别。内容非常详细。感兴趣的朋友可以参考一下,希望对你有所帮助。

00-1010ml lib是Spark的机器学习(ml)库。它的目标是使实用的机器学习变得可扩展和容易。在高层次上,它提供了以下工具:

ML算法:分类、回归、聚类、协同过滤等通用学习算法。

特征提取、特征提取、变换、降维和选择。

管道:用于构建、评估和调整ML管道的工具。

持久性:保存和加载算法、模型和管道

实用性:线性代数、统计学、数据处理等。

机器学习库(MLlib)

MLlib基于RDD的API现在处于维护模式。

自Spark 2.0以来,包中位于RDD的APIspark.mllib已进入维护模式。Spark的主要机器学习API现在是包中基于DataFrame的APIspark.ml。

有什么影响?

MLlib仍将支持总部位于RDD的APIspark.mllib并修复该错误。

MLlib不会向基于RDD的API添加新功能。

在Spark 2.x版本中,MLlib将向基于DataFrame的API添加函数,以实现与基于RDD的API的功能等效。

达到功能等同(粗略估计为Spark 2.2)后,将放弃基于RDD的API。

基于RDD的应用编程接口预计将在Spark 3.0中删除。

为什么MLlib切换到基于DataFrame的API?

数据帧提供了比RDD更友好的应用编程接口。数据框架的许多优势包括Spark数据源、SQL/数据框架查询、钨和催化剂优化以及跨语言的统一应用编程接口。

MLlib基于DataFrame的API提供跨ML算法和跨多种语言的统一API。

数据框方便了实际的ML管道,尤其是函数转换。

什么是“Spark ML”?

“Spark ML”不是一个正式的名称,但偶尔会用来指代基于MLlib DataFrame的API。这主要是由于org.apache.spark.ml基于DataFrame的API所使用的Scala包名以及我们最初用来强调管道概念的术语“Spark ML Pipelines”。

MLlib是否被弃用?

MLlib号包括基于RDD的API和基于数据框架的API。基于RDD的应用编程接口现在处于维护模式。

公告:基于DataFrame的API是主要的API

MLlib使用线性代数包Breeze,它依赖netlib-java进行优化的数值处理。如果该库在运行时不可用,您将看到一条警告消息,并将改用纯JVM实现。

由于运行时专有二进制文件netlib-java的授权问题,默认情况下,我们不包括本地代理。要配置netlib-java/Breeze使用系统优化的二进制文件,请将com . github . fommil . netlib : all :1 . 1 . 2(或build Spark-Pnetlib-lgpl)作为项目的依赖项,并阅读netlib-java文档了解平台的其他安装说明。

要在Python中使用MLlib,您将需要NumPy1.4或更高版本。

Spark中的MLlib和ML库有什么区别?我在这里分享一下。我希望

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/149264.html

(0)

相关推荐

  • 圆锥体的表面积,圆柱圆锥体积表面积公式

    技术圆锥体的表面积,圆柱圆锥体积表面积公式圆柱体积=底面积×高=πr²×h(r是底面圆半径圆锥体的表面积,h为高)圆锥体积=同底圆柱体积×1/3圆柱表面积=2个圆的面积+侧面面积=2•πr²+πd×h(d是底面圆直径)(

    生活 2021年10月28日
  • apacheflink零基础系列教程(flink脱离hadoop使用)

    技术如何在Apache Flink中使用RocksDB状态后端如何在Apache Flink中使用RocksDB状态后端,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简

    攻略 2021年12月23日
  • python如何爬取基金股票最新数据并用excel绘制树状图

    技术python如何爬取基金股票最新数据并用excel绘制树状图python如何爬取基金股票最新数据并用excel绘制树状图,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到

    攻略 2021年10月26日
  • 分数化小数,数学家是怎么将分数化为小数的

    技术分数化小数,数学家是怎么将分数化为小数的说说自己吧分数化小数!1986年看了《小学数学教师》第4期鲍刚的一篇《质数之最》,产生了对数的计算。于是,贪黑爬半夜地算分数化小数。
    开始用竖式计算单位分数化小数。
    这样算,觉

    生活 2021年10月28日
  • 鲁班出装,s23鲁班最强出装和铭文

    技术鲁班出装,s23鲁班最强出装和铭文铭文搭配鲁班出装:鹰眼*10 夺萃*5+狩猎*5 无双*3+祸源*7
    出装:
    鉴于鲁班自带招仇恨的体质,建议大家第一件先做抵抗鞋。鲁班需要尽早地做出电刀,因为鲁班的被动扫射速度是和攻

    生活 2021年10月24日
  • 一句,你读过最美的一句话是什么

    技术一句,你读过最美的一句话是什么之一,友人在信中说:“那时只知沉湎于对生命的思考,常被一种极大的感召召唤到深邃中,思索一些人性与社会方面的东西”一句。许是源于对生命和理想的探索与追求,友人才作如此的叙述。哭墙隐现于生命

    生活 2021年10月20日