小贝子编程

使用pyspark将两个不同行的值添加为一个

本文关键字：添加一个 pyspark 两个使用 python pyspark
更新时间 : 2023-09-22
英文 : adding values from two different rows into one using pyspark

我有两行完全相同的数据，但这两行之间的列变化:

5.12 2.20

您需要使用array_join函数将collect_list的结果用逗号(，)连接起来。

df = df.groupBy('id', 'product').agg(
F.array_join(F.collect_list('class'), ',').alias('class'),
F.sum('cost').alias('cost')
)

最新更新

Gitlab CI and php verstion
ROS2-Gazebo:在立方体的一侧显示图像
appery.模态离子1中的IO固定组件
一种检查is_explicit _constructible的方法
从电子表格自动填充谷歌文档
由CSS值更改触发的CSS动画
CSS Sticky属性在本演示中不起作用
NodeJs与xmlrpc服务器通信，并对node-xmlrpc库进行base64编码，将下载的url图像编码为base
在管道中使用powershell如何使用在azure devops中触发的管道运行来获取shelvesset编号.<
我希望在表格单元格内的左、右位置的同一行中有不同的文本
Entity Framework ExecuteDelete没有按预期工作
颤振只加载某些riv (.riv)文件
Python问题我如何循环回我的代码?
asyncpg.exceptions.InvalidAuthorizationSpecificationError Py
为什么我的阅读更多按钮不工作?
如何得到拆分字符后的单词
在列表框之间移动项
设置 SKEmitterNode 的 'targetNode' 会导致奇怪的 'zPosition' 行为
我无法在斐波那契数列 python 中加强术语
用Jest测试使用jquery获取数据的异步函数
c#与HTML敏捷包不能得到div类的值
Python 中的 OOP 层次结构
我如何动画下拉菜单的高度使用顺风css
无法从字符串比较失败的字符串中删除"—"
无法获取熊猫数据帧中的第一列值
Odoo添加按钮应该重定向到我的模块视图
r语言 - 我如何得到比例在数据表没有组号重复?
无法使用 conda env 导入 OCI 笔记本会话中的模型配置详细信息
c - while循环中VSC的分段错误
无法将url数据获取到模型类中

使用pyspark将两个不同行的值添加为一个

相关内容

最新更新

热门标签：