每次都追加而不从头开始重新启动阵列



我有这段代码:

import pandas as pd
import numpy as np
data = np.random.rand(50,4)
df = pd.DataFrame(data)
# LOOPING BY CHUNKS, STORING EACH CHUNK IN A NP ARRAY INSIDE A LIST
ix = 0
chunk = 10
arrays = []
for iy in range(chunk, len(df)+chunk, chunk):
arrays.append(df.iloc[ix:iy])
ix = iy
print(arrays)

问题是,当我打印数组时,它每次都从头开始,当我需要它来启动下一个数组时,前一个数组停止了。 澄清一下,在这个例子中,我有 1 个 10 行的数组,然后再次打印第一个数组和接下来的 10 行,然后打印两个数组并添加下一个数组,依此类推......我想摆脱重复部分(不仅在印刷中,而且在整个循环中(,但找不到如何做到这一点。

你快到了,只是混淆了用于数据子集的变量。尝试这样的事情:

# LOOPING BY CHUNKS, STORING EACH CHUNK IN A NP ARRAY INSIDE A LIST
ix = 0
chunk = 10
arrays = []
for x in range(0, len(df), chunk):
array = df.iloc[x: x+chunk]
arrays.append(array)
print(array)

最新更新