我想取特定列[col1]的每10000行的平均值,并将其存储在新列中?
我尝试使用下面的代码。
df['Average'] = df['col1'].rolling(10000).mean()
取0到10000的平均值,然后取1到10000的平均值
使用自定义grouper与numpy.arange
,然后groupby.transform('mean')
:
import numpy as np
N = 10_000
df['Average'] = (df['col1'].groupby(np.arange(len(df))//N)
.transform('mean')
)