在pyspark中,如果我使用以下代码计算最大值,我将得到类似"Row(max(age(=5(]"的结果。但是有没有办法将输出值 5 保存到 max_age 等参数中?
print(x.agg({"age": "max"}).collect())
是的,你可以。您只需要提取值。
max_age = x.agg({"age": "max"}).collect()[0]['max(age)']