根据 if 条件合并并求和两行熊猫行



我有一个巨大的数据帧,我想merge only two rows in it based on if condition。下面是一个示例数据框,当我尝试这样做时groupby sum其他行也会受到影响。

我只想要带有generic的列jb_name以获得merged and sum.

jb_name   jb_count
0   generic    10
1   generic1    2
2   generic    15
3   other      14

尝试了以下内容,但正如我所说,它也会影响其他行

df = df.groupby(['jb_name'])['jb_count'].sum().reset_index()

我想要最终的 df 如下

jb_name   jb_count
0   generic    25
1   generic1    2
3   other      14

或者,我们可以将索引设置为jb_name并在索引genericlevel 0上使用sum

df = df.set_index('jb_name')
mask = (df.index == 'generic')
df1 = pd.concat([df[mask].sum(level=0), df[~mask]]).reset_index()

结果:

# print(df1)
jb_name  jb_count
0   generic        25
1  generic1         2
2     other        14
#Bollean select, droupby as you sum the duplicated and append tthe no duplicates
m=df.jb_name=='generic'
df[m].groupby(by='jb_name', axis=0).sum().reset_index().append(df[~m])

jb_name  jb_count
0   generic        25
1  generic1         2
3     other        14

使用:

mask = df['jb_name'] == 'generic'
df = df[mask].groupby('jb_name', as_index=False).sum().append(df[~mask], ignore_index=True)

最新更新