聚合与 pyspark 中的最小值



我正在尝试以最小值聚合数据日期。我尝试使用 groupby(),但它给出了一个错误。

   history= history.selectExpr('aaa'
        , 'bbb'
        , 'ccc'
        , 'date')
        history=history.groupBy()('aaa','bbb','ccc',min('date'))

我先试了

       history= history.selectExpr('aaa'
            , 'bbb'
            , 'ccc'
            , min('date'))

但它也没有用

谢谢:)

你可以

简单地这样做:

from pyspark.sql import functions as F
history.groupBy("AAA","BBB","CCC").agg(F.min("date"))

相关内容

  • 没有找到相关文章

最新更新