我有一个这样的DataFrame:
colA colB
1 aaa
1 rrr
1 www
2 bbb
2 ccc
2 sss
...
我想转换数据帧如下
colA Sum
1 wwwrrraaa
2 ssscccbbb
...
我试过
df.groupby(['colA'])['colB'].sum().reset_index()
但是字符串的和是相反的。有没有一种优雅的方法可以做到这一点?
不要使用sum来连接字符串。它看起来很花哨,但它是二次型的,应该被认为是糟糕的做法。在python中使用函数join
df = df[::-1].groupby('colA')['colB'].agg(''.join).reset_index()
反转DataFrame;则groupby
+sum
:
out = df[::-1].groupby('colA', as_index=False)['colB'].sum()
输出:
colA colB
0 1 wwwrrraaa
1 2 ssscccbbb