小贝子编程

如何在apachebeam中实现groupby(column1，column2)

本文关键字：column1 column2 groupby 实现 apachebeam google-cloud-dataflow apache-beam
更新时间 : 2023-09-19
英文 : How to implement groupby(column1,column2) in apache beam

我需要帮助在python中为以下Spark sql代码编写类似的beam代码。

count_mnm_df = (mnm_df
.select("State", "Color", "Count") 
.groupBy("State", "Color") 
.agg(count("Count").alias("Total")) 
.orderBy("Total", ascending=False)

可能最直接的映射是Beam SQL。请参阅此处了解更多信息。请参阅此处以获取相应的Python转换，其中还包含有关用法的信息。请注意，对Python SDK的支持是通过Beam的跨语言转换支持实现的，这是相对较新的。

也可以考虑使用执行相同计算的可用梁变换来编写梁管道。

请注意，Beam并不保证PCollection的元素的顺序。

最新更新

云构建触发器不应该基于git提交消息创建docker映像
r语言 - 根据标准删除列表组件
无法从用户获取数字并将其作为javascript切片方法的参数传递
在JavaScript中对JSON进行排序
React Axios Delete不每次渲染
Spring boot, Spring Security, React -自定义过滤器认证不起作用
SSIS通过TDS端点连接到Dynamics CRM Online
音频不能通过javaScript播放
MPI_Gather不收集所有块到recv缓冲区?
react hook是如何工作的?为什么useState跟踪的值在重新呈现时没有重置?
如何在颤振中自动点击按钮
如何将具有公共文件夹的react vite应用程序部署到我的域上的子文件夹?
S3FS连接器Pyspark 3.2, Hadoop 3.3.1挂在spark.read.load()
Flutter在不更改上下文区域设置的情况下在小部件内获取语言字符串
fluentd: ignore_repeated_log_interval and ignore_same_log_in
Psycopg2 无法适应间歇性发生的类型"元组"问题
从terraform创建发布模式定义时出错
Pine脚本代码为策略给出错误.入口函数
如何从javascript中的API调用返回值给React组件
Oracle检查巨大的插入进度
输入2位数时程序不能正常工作
Python解析嵌套的JSON文件并取出所需的属性
MongooseError:Model.create()不再接受回调如何使用异步等待
如何将bot/命令限制到某个通道?
SwiftUi调用中的额外参数当调用主视图中@EnvironmentObject的两个视图时
无法从反应-选择下拉Robotframework中选择选项
Intel Intrinsic: Load interleaved float32
使用base64.解码或base64.RawStdEncoding解码base64字符串在Go &g
如何使用Angular加载HTML附加div中的动态数据
RTL文本在react-native项目中没有正确对齐

如何在apachebeam中实现groupby(column1，column2)

相关内容

最新更新

热门标签：