我使用pivot_table命令创建了一个数据帧。数据帧有351行和120列。数据帧如下所示:
RY 2011 ... 2020
Month 1 2 3 4 5 6 7 8 9 10 ... 3 4 5 6 7 8 9 10 11 12
ID
AB10 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 0
AB1286 0 0 0 0 2 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 0
AB1951 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 0
AB2 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 0
AB2338 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 0
现在我想计算ID的12个月的滚动总和。我写了以下命令来计算滚动总和:
df.groupby('ID').rolling(12,on='Month').sum()
然而,它给出了以下错误:
ValueError: invalid on specified as Month, must be a column (of DataFrame), an Index or None
有人能帮我解决这个问题吗?
在创建数据透视表之前,请尝试运行该代码。但是,请确保您首先创建一个带有以下内容的日期时间列:
df['Date'] = pd.to_datetime(df['Year'].astype(str) + '-' + df['Month'].astype(str) + '-01')
然后:
df.groupby('ID').rolling(12,on='Date').sum()
什么是"ID";包含你试过用来转换数据透视表吗?
df.T.groupby('ID').rolling(12,on='Month').sum()