如何在熊猫中一次对"n"行进行求和?

给定一个数据框

此数据框有 20 列。我想一次对n=5行进行分组并汇总它们。因此，我的输出如下所示：

df.rolling_sum无济于事，因为它不允许你在求和时改变步幅。

还有什么其他方法可以做到这一点？

df.set_index(df.index // 5).sum(level=0)

如果你可以用总和而不是系列来管理一个 ndarray(无论如何你总是可以再次构造一个系列(，你可以使用np.add.reduceat.

np.add.reduceat(df.A.values, np.arange(0, df.A.size, 5))

在这种情况下返回

array([250, 347, 266, 328])

假设索引是连续的，则可以对df.index执行整数除法，然后按索引分组。

对于上述df，您可以执行以下操作：

df.index // 5
# Int64Index([0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3], dtype='int64')

获得最终答案只是再一步，使用df.groupby和dfGroupBy.sum：

df.groupby(df.index // 5).sum()
A
0  250
1  347
2  266
3  328

如果没有RangeIndex，请先使用df.reset_index，然后再使用组。

相关内容