小贝子编程

根据Scala元组中的一个值对RDD进行排序

本文关键字：一个 RDD 排序元组 Scala 根据 scala sorting apache-spark rdd
更新时间 : 2023-09-09
英文 : Sort RDD based on a value in a tuple in Scala

假设我的RDD为3行如下

{(Sam, 23), 1}
{(Ram, 32), 5}
{(Dan, 25), 2}

第一列是说的元组（名称，年龄）。在Scala中，如何仅基于第一列中的名称字段对此RDD进行排序？同样，如何根据年龄对此RDD进行排序？

使用 sortBy

val rdd : RDD[((String,Int),Int)] = ???
rdd.sortBy{case ((name,age),_) => name}

按年龄排序：

rdd.sortBy{case ((name,age),_) => age}

sparkContext.parallelize(Array( ("Sam", 23),("Ram", 32),("Dan", 25) )).sortBy(_._1)//If it's inverted order,input false ,If you pass the age _1 to _2 .foreach(println)在此处输入图像描述

最新更新

如何从javascript中的API调用返回值给React组件
Oracle检查巨大的插入进度
输入2位数时程序不能正常工作
Python解析嵌套的JSON文件并取出所需的属性
MongooseError:Model.create()不再接受回调如何使用异步等待
如何将bot/命令限制到某个通道?
SwiftUi调用中的额外参数当调用主视图中@EnvironmentObject的两个视图时
无法从反应-选择下拉Robotframework中选择选项
Intel Intrinsic: Load interleaved float32
使用base64.解码或base64.RawStdEncoding解码base64字符串在Go &g
如何使用Angular加载HTML附加div中的动态数据
RTL文本在react-native项目中没有正确对齐
如何在类型语法中使用值
在离子反应项目中加入手电筒
模板中的Angular条件
Unity3D在比较两个字符串时出现stackoverflow错误
c-为什么使用多个线程会导致执行速度减慢
从r中的数据名列表中合并多个数据名的循环
Rails新命令给出错误
WordPress表单提交问题
如何使用pack创建左、右和中心框架?
在Django Rest框架中通过属性或自定义字段来排序模型
获取下面字符串中倒数第二个单词
连接所有JSON对象字符串值
如何了解tensorflow模型的tensorflow版本?
如何使用queryInterface.bulkUpdate从Sequelize当有必要检查一个键是否存在于jsonb列?
jQuery Datatables 按钮：['excel'] 在 document.ready() 中构建表时不起作用，但在动态构建表时起作用
r语言 - 我如何创建一个新的列，根据两个列中的行分配的条件值?
在Django中从文件路径生成媒体url
Python:为什么我在这两个问题上得到typeerror ?(递归)

根据Scala元组中的一个值对RDD进行排序

相关内容

最新更新

热门标签：