PySpark 将列的最大值保存到参数中?



在pyspark中,如果我使用以下代码计算最大值,我将得到类似"Row(max(age(=5(]"的结果。但是有没有办法将输出值 5 保存到 max_age 等参数中?

print(x.agg({"age": "max"}).collect())

是的,你可以。您只需要提取值。

max_age = x.agg({"age": "max"}).collect()[0]['max(age)']

最新更新