我正在尝试以最小值聚合数据日期。我尝试使用 groupby(),但它给出了一个错误。
history= history.selectExpr('aaa'
, 'bbb'
, 'ccc'
, 'date')
history=history.groupBy()('aaa','bbb','ccc',min('date'))
我先试了
history= history.selectExpr('aaa'
, 'bbb'
, 'ccc'
, min('date'))
但它也没有用
谢谢:)
你可以
简单地这样做:
from pyspark.sql import functions as F
history.groupBy("AAA","BBB","CCC").agg(F.min("date"))