Pandas Groupby with Aggregates



我正在研究熊猫,我想知道以下示例中应用的统计函数是否存在差异,以及是否存在某些情况下一个比另一个更受欢迎。

  1. df.groupby('A')['B'].agg('min')
  2. df.groupby('A')['B'].min()

这两段代码给出了相同的期望输出。但agg函数在可应用的函数数量方面更为通用。

例如,您可以对agg

执行以下操作
df.groupby('A')['B'].agg(['min', 'max', 'mean'])

另一个区别是,应用单个函数,即min将在您的情况下给您Series,agg的输出可以是SeriesDataFrame

根据我的经验,它们之间没有区别,因为底层功能是np.min

def min(self, numeric_only: bool = False, min_count: int = -1):
return self._agg_general(
numeric_only=numeric_only, min_count=min_count, alias="min", npfunc=np.min
)

npfunc=np.min

最新更新