如何转置RDD或MLLib矩阵

技术如何将RDD或者MLLib矩阵进行转置操作如何将RDD或者MLLib矩阵进行转置操作,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。如何将

如何转置RDD或MLLib矩阵,很多新手都不是很清楚。为了帮助大家解决这个问题,下面小编就详细讲解一下。需要的人可以从中学习,希望你能有所收获。

如何转置Spark Mllib或一个RDD的矩阵。Spark Mllib的矩阵有多种形式,分布式的和非分布式的,非分布式的矩阵这里就不提了,因为是基于数组的,所以很简单。虽然分布式存储是基于RDD的,但问题变成了如何转置RDD。

首先,我们来介绍一下什么是转置运算:

根据百科中的定义,交换矩阵的行和列得到的矩阵就是矩阵的转置。

如果要交换一个RDD的军衔,主要思路如下:

1、首先变换RDD,并给每行一个唯一的行号(row,rowIndex)。

2.对于RDD的每一行,它都被转换为(value,colindex)并排序为(colIndex)。tolong,(rowindex,value))

3.执行平面图

4.完成第3步后,我们只需要按照3key分组,按照它的键排序,就可以得到转换后的列顺序。

5.步骤4完成后,我们可以根据每行的rowIndex,value)构造带有下标及其值的新行,从而保证转换后每行的顺序。

到的转换完成。

具体步骤如下:

def transposserowmatrix(m :行矩阵):行矩阵={ 0

val transposedRowsRDD=m . rows . zippwithindex . map { case(row,row index)=row totransposedtriplet(row,rowIndex)}。flat map(x=x)//(new rownindex,(newColIndex,value))。groupByKey。sortByKey()。map(_。_2) //对行进行排序并删除索引。映射(buildRow) //使用索引和值重新构建每一行,并删除索引。

新行矩阵

}

//转换每一行

def rowtortransposedtriplet(row : Vector,rowIndex: Long):数组[(Long,(Long,Double))]={ 0

val index edrow=row . to array . zipcwithindex

indexedRow.map{case (value,colIndex)=(colIndex.toLong,(rowIndex,value))}

}

//创建新行

def buildRow(row withindex : Iterable[(Long,Double)]): Vector={ 0

val resArr=新数组[双精度]

rowWithIndexes.foreach{case(索引,值)=

resArr(index.toInt)=值

}

vectors . density(ReSarr)

}测试

准备数据

val观测值=sc.parallelize(

Seq(

vectors . density(1.0,10.0,100.0,2.0),

向量.密集(2.0,20.0,200.0,2.0),

向量.密集(3.0,30.0,300.0,2.0)

)

)生成矩阵

valmat :行矩阵=新行矩阵(观察)如何将RDD或者MLLib矩阵进行转置操作

你会发现军衔已经互换了。

阅读以上内容对你有帮助吗?如果您想了解更多相关知识或阅读更多相关文章,请关注行业资讯频道,感谢您的支持。

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/154318.html

(0)

相关推荐

  • debian如何修改apache2 https端口为11443

    技术debian如何修改apache2 https端口为11443本篇文章为大家展示了debian如何修改apache2 https端口为11443,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希

    攻略 2021年11月12日
  • ps怎么添加笔刷,ps字体和笔刷怎么安装

    技术ps怎么添加笔刷,ps字体和笔刷怎么安装1下载的字体如何安装到PS里ps怎么添加笔刷?首先,打开我的电脑——控制面板——外观和主题——字体(或者找C:\WINDOWS\Fonts)然后,打开下载的解压包(确认你的电脑

    生活 2021年10月20日
  • 美容医院排行,中国排名前十的美容院有哪些

    技术美容医院排行,中国排名前十的美容院有哪些御尚坊颜连锁美容院、梵玛西美容品牌、北京御蜂坊·蜂SPA美容、兰黛之谜、娇悦诗、百莲凯、克丽缇娜、雅致轩、蔓菲国际、美莱。美容行业是最有前景的八大行业之一美容医院排行,目前国内

    生活 2021年10月31日
  • 加拿大动物,加拿大的代表动物是什么

    技术加拿大动物,加拿大的代表动物是什么加拿大的国兽,海狸(英语叫BEAVER),也叫河狸,它是一种躯体肥胖的啮齿类动物,外型酷似大老鼠。海狸身上有两宝,一种是用于制作香水的原料,属于海狸性腺分泌的液体;另一种是海狸油光水

    生活 2021年10月27日
  • 如何才能让服务器保持稳定运行(怎么让自己的服务器更受欢迎)

    技术如何让服务器随时保持最佳状态今天就跟大家聊聊有关如何让服务器随时保持最佳状态,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。服务器的维护是运维工作的重点,如何通

    攻略 2021年12月22日
  • 电动车好学吗,大提琴好学还是中提琴好学

    技术电动车好学吗,大提琴好学还是中提琴好学我是学小提琴的电动车好学吗,我只想告诉楼主大提琴你上了高中开始学都来的及,中提琴难度和小提琴差不多,必须从小开始练琴,我们好多现在学中提琴的同学都是从小提琴转过来的,练大提琴的同

    生活 2021年10月22日