使用pandas DataFrameGroupBy对象的更好方法



好的,所以这更多的是一个关于如何正确使用groupby方法的问题,因为我有点难以使用DataFrameGroupBy对象本身。基本上,我有一个大的DataFrame,结构如下:

<表类> 日期 产品价格能力tbody><<tr>01.07.2022NEG_00_043, 7701.07.2022NEG_00_041, 7301.07.2022NEG_00_042, 4501.07.2022NEG_00_042, 2701.07.2022POS_00_043, 7201.07.2022POS_00_043、2501.07.2022POS_00_041, 5201.07.2022POS_00_042, 43

使用说明:

df = df.sort_values('PRICE')
df['CUMULATIVE'] = df.groupby(by=['DATE', 'PRODUCT'])['CAPACITY'].cumsum()

或:

df = df.sort_values(['PRICE','DATE', 'PRODUCT'])
df['CUMULATIVE'] = df.groupby(by=['DATE', 'PRODUCT'])['CAPACITY'].cumsum()

最新更新