我正在尝试使用pandas数据框架库将大量数据汇总在一起,用于新冠肺炎分析。下面是我的表格的示例:
Category Sub Value1 Value2
A a1 2 6
a2 5 7
a3 4 1
B b1 6 3
b2 4 2
C c1 5 8
c2 8 9
c3 1 1
这是所需的输出表:
注意,A的所有子类别,即(a1,a2,a3(在输出表中求和。
Category Value1 Value2
A 11 14
B 10 5
C 14 18
在提问之前,您应该先自己查找熊猫的基本知识。
df.groupby('Category')[['Value1','Value2']].sum()