有没有一种更有效或更简洁的方法可以根据索引列表划分df



我正在尝试对以下数据帧进行切片/分割

df = pd.DataFrame(
{'time': [4, 10, 15, 6, 0, 20, 40, 11, 9, 12, 11, 25], 
'value': [0, 0, 0, 50, 100, 0, 0, 70, 100, 0,100, 20]}    
)

根据要拆分的索引列表:

[5, 7, 9]

列表的第一项和最后一项是数据帧的第一个和最后一个索引。因此,我试图获得以下四个数据帧(由三个给定的索引和原始df的开头和结尾定义(,每个数据帧都分配给自己的变量:

time  value
0     4      0
1    10      0
2    15      0
3     6     50
4     0    100
time  value
5    20      0
6    40      0
time  value
7    11     70
8     9    100
time  value
9     12      0
10    11    100
11    25     20

我目前的解决方案给了我一个数据帧列表,然后我可以通过列表索引手动将其分配给变量,但代码有点复杂,我想知道是否有更简单/更有效的方法可以做到这一点。

indexes = [5,7,9]
indexes.insert(0,0)
indexes.append(df.index[-1]+1)
i = 0
df_list = []
while i+1 < len(indexes):
df_list.append(df.iloc[indexes[i]:indexes[i+1]])
i += 1

这一切都源于我试图回答这个问题。我相信有更好的方法来回答这个问题,但我确实觉得应该有一种更简单的方法来做这种切片,正如我所想的那样。

您可以像一样使用np.split

df_list = np.split(df, indexes)

最新更新