我有几个熊猫数据帧,我正在尝试找到一种好方法来计算和绘制每个唯一条目跨数据帧出现的次数。例如,如果我有以下 2 个数据帧:
year month
0 1900 1
1 1950 2
2 2000 3
year month
0 1900 1
1 1975 2
2 2000 3
我在想也许有一种方法可以将它们合并到单个数据帧中,同时使用新的列counts
来跟踪任何数据帧中唯一year + month
组合发生的次数。从那里我想我可以分散图year + month
组合及其相应的计数。
year month counts
0 1900 1 2
1 1950 2 1
2 2000 3 2
3 1975 2 1
有没有实现这一点的好方法?
concat
然后使用groupby
agg
pd.concat([df1,df2]).groupby('year').month.agg(['count','first']).reset_index().rename(columns={'first':'month'})
Out[467]:
year count month
0 1900 2 1
1 1950 1 2
2 1975 1 2
3 2000 2 3