我正在研究熊猫,我想知道以下示例中应用的统计函数是否存在差异,以及是否存在某些情况下一个比另一个更受欢迎。
df.groupby('A')['B'].agg('min')
df.groupby('A')['B'].min()
这两段代码给出了相同的期望输出。但agg
函数在可应用的函数数量方面更为通用。
例如,您可以对agg
df.groupby('A')['B'].agg(['min', 'max', 'mean'])
另一个区别是,应用单个函数,即min
将在您的情况下给您Series
,agg
的输出可以是Series
或DataFrame
根据我的经验,它们之间没有区别,因为底层功能是np.min
def min(self, numeric_only: bool = False, min_count: int = -1):
return self._agg_general(
numeric_only=numeric_only, min_count=min_count, alias="min", npfunc=np.min
)
npfunc=np.min