如何在panda中计算和广播计数?
计算计数:
df.groupby('field').size()
向原始数据帧广播聚合:
df.groupby('field')['field_to_aggregate'].transform(aggregation)
如果我指定要聚合到的字段以及sum
、mean
等聚合,则后者有效。但当我想要对分组字段进行简单计数时,我找不到使其有效的方法。
(注意:我可以只使用原始表上的第一个和重新连接,而不是按表分组,但我想避免连接,我正在寻找一个使用Panda的transform
的有效解决方案(
您可以尝试:
result = df.groupby('field')['field_to_aggregate'].transform('size')
注意,'field_to_aggregate'
可以与'field'
相同。