组合熊猫数据帧以提供唯一的元素计数



我有几个熊猫数据帧,我正在尝试找到一种好方法来计算和绘制每个唯一条目跨数据帧出现的次数。例如,如果我有以下 2 个数据帧:

year    month
0    1900    1
1    1950    2
2    2000    3
year    month
0    1900    1
1    1975    2
2    2000    3

我在想也许有一种方法可以将它们合并到单个数据帧中,同时使用新的列counts来跟踪任何数据帧中唯一year + month组合发生的次数。从那里我想我可以分散图year + month组合及其相应的计数。

year    month    counts
0    1900    1        2
1    1950    2        1
2    2000    3        2
3    1975    2        1

有没有实现这一点的好方法?

concat然后使用groupbyagg

pd.concat([df1,df2]).groupby('year').month.agg(['count','first']).reset_index().rename(columns={'first':'month'})
Out[467]: 
year  count  month
0  1900      2      1
1  1950      1      2
2  1975      1      2
3  2000      2      3

最新更新