小贝子编程

透视单行数据框，其中不能应用groupBy

本文关键字：不能应用 groupBy 单行数据透视 apache-spark pyspark
更新时间 : 2023-09-22
英文 : pivoting a single row dataframe where groupBy can not be applied

我有一个这样的数据框架:

inputRecordSetCount

您可以使用本教程中提到的stack()操作。

因为有3个唯一的值，传递大小，对标签和列名:

stack(3, "inputRecordSetCount", inputRecordSetCount, "inputRecordCount", inputRecordCount, "suspenseRecordCount", suspenseRecordCount) as (operation, value)

完整的示例:

df = spark.createDataFrame(data=[[166,1216,10]], schema=['inputRecordSetCount','inputRecordCount','suspenseRecordCount'])
cols = [f'"{c}", {c}' for c in df.columns]
exprs = f"stack({len(cols)}, {', '.join(str(c) for c in cols)}) as (operation, value)"
df = df.selectExpr(exprs)
df.show()
+-------------------+-----+
|          operation|value|
+-------------------+-----+
|inputRecordSetCount|  166|
|   inputRecordCount| 1216|
|suspenseRecordCount|   10|
+-------------------+-----+

透视单行数据框，其中不能应用groupBy

相关内容

最新更新

热门标签：