如何转置RDD或MLLib矩阵

技术如何将RDD或者MLLib矩阵进行转置操作如何将RDD或者MLLib矩阵进行转置操作,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。如何将

如何转置RDD或MLLib矩阵,很多新手都不是很清楚。为了帮助大家解决这个问题,下面小编就详细讲解一下。需要的人可以从中学习,希望你能有所收获。

如何转置Spark Mllib或一个RDD的矩阵。Spark Mllib的矩阵有多种形式,分布式的和非分布式的,非分布式的矩阵这里就不提了,因为是基于数组的,所以很简单。虽然分布式存储是基于RDD的,但问题变成了如何转置RDD。

首先,我们来介绍一下什么是转置运算:

根据百科中的定义,交换矩阵的行和列得到的矩阵就是矩阵的转置。

如果要交换一个RDD的军衔,主要思路如下:

1、首先变换RDD,并给每行一个唯一的行号(row,rowIndex)。

2.对于RDD的每一行,它都被转换为(value,colindex)并排序为(colIndex)。tolong,(rowindex,value))

3.执行平面图

4.完成第3步后,我们只需要按照3key分组,按照它的键排序,就可以得到转换后的列顺序。

5.步骤4完成后,我们可以根据每行的rowIndex,value)构造带有下标及其值的新行,从而保证转换后每行的顺序。

到的转换完成。

具体步骤如下:

def transposserowmatrix(m :行矩阵):行矩阵={ 0

val transposedRowsRDD=m . rows . zippwithindex . map { case(row,row index)=row totransposedtriplet(row,rowIndex)}。flat map(x=x)//(new rownindex,(newColIndex,value))。groupByKey。sortByKey()。map(_。_2) //对行进行排序并删除索引。映射(buildRow) //使用索引和值重新构建每一行,并删除索引。

新行矩阵

}

//转换每一行

def rowtortransposedtriplet(row : Vector,rowIndex: Long):数组[(Long,(Long,Double))]={ 0

val index edrow=row . to array . zipcwithindex

indexedRow.map{case (value,colIndex)=(colIndex.toLong,(rowIndex,value))}

}

//创建新行

def buildRow(row withindex : Iterable[(Long,Double)]): Vector={ 0

val resArr=新数组[双精度]

rowWithIndexes.foreach{case(索引,值)=

resArr(index.toInt)=值

}

vectors . density(ReSarr)

}测试

准备数据

val观测值=sc.parallelize(

Seq(

vectors . density(1.0,10.0,100.0,2.0),

向量.密集(2.0,20.0,200.0,2.0),

向量.密集(3.0,30.0,300.0,2.0)

)

)生成矩阵

valmat :行矩阵=新行矩阵(观察)如何将RDD或者MLLib矩阵进行转置操作

你会发现军衔已经互换了。

阅读以上内容对你有帮助吗?如果您想了解更多相关知识或阅读更多相关文章,请关注行业资讯频道,感谢您的支持。

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/154318.html

(0)

相关推荐

  • 歌吟的意思,古代文人雅士的啸是什么意思

    技术歌吟的意思,古代文人雅士的啸是什么意思啸,一种歌吟方式歌吟的意思。啸,一种歌吟方式,称之为“啸”。啸不承担切实的内容,不遵守既定的格式,只随心所欲地吐露出一派风致,一腔心曲,因此特别适合乱世名士。历史上的魏晋时期多有

    生活 2021年10月27日
  • 如何分析CVE-2018-6789Exim缓冲区溢出漏洞

    技术如何进行CVE-2018-6789Exim缓冲区溢出漏洞分析本篇文章为大家展示了如何进行CVE-2018-6789Exim缓冲区溢出漏洞分析,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你

    攻略 2021年12月20日
  • Hibernate Session有什么用

    技术Hibernate Session有什么用这篇文章主要讲解了“Hibernate Session有什么用”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Hibernat

    攻略 2021年12月4日
  • redis中的五种基本类型(redis的几种类型分别适用什么场景)

    技术redis层级结构是怎样的本篇内容主要讲解“redis层级结构是怎样的”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“redis层级结构是怎样的”吧!redis中保存数据时

    攻略 2021年12月23日
  • 控制流程语句

    技术控制流程语句 控制流程语句控制流程语句:
    语句:就是使用分号分的代码就是一个语句。
    顺序语句:就式从上往下执行所有代码就是语句。int i = 3;  //声明变量语句;  //空语句Sstem.o

    礼包 2021年12月13日
  • Python如何实现找到列表中的奇偶异常项

    技术Python如何实现找到列表中的奇偶异常项这篇文章将为大家详细讲解有关Python如何实现找到列表中的奇偶异常项,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。1.find_pari

    攻略 2021年11月14日