以熊猫为单位计算和广播计数(使用groupby变换)



如何在panda中计算和广播计数?

计算计数:

df.groupby('field').size()

向原始数据帧广播聚合:

df.groupby('field')['field_to_aggregate'].transform(aggregation)

如果我指定要聚合到的字段以及summean等聚合,则后者有效。但当我想要对分组字段进行简单计数时,我找不到使其有效的方法。

(注意:我可以只使用原始表上的第一个和重新连接,而不是按表分组,但我想避免连接,我正在寻找一个使用Panda的transform的有效解决方案(

您可以尝试:

result = df.groupby('field')['field_to_aggregate'].transform('size')

注意,'field_to_aggregate'可以与'field'相同。

最新更新