我正在尝试对以下数据帧进行切片/分割
df = pd.DataFrame(
{'time': [4, 10, 15, 6, 0, 20, 40, 11, 9, 12, 11, 25],
'value': [0, 0, 0, 50, 100, 0, 0, 70, 100, 0,100, 20]}
)
根据要拆分的索引列表:
[5, 7, 9]
列表的第一项和最后一项是数据帧的第一个和最后一个索引。因此,我试图获得以下四个数据帧(由三个给定的索引和原始df的开头和结尾定义(,每个数据帧都分配给自己的变量:
time value
0 4 0
1 10 0
2 15 0
3 6 50
4 0 100
time value
5 20 0
6 40 0
time value
7 11 70
8 9 100
time value
9 12 0
10 11 100
11 25 20
我目前的解决方案给了我一个数据帧列表,然后我可以通过列表索引手动将其分配给变量,但代码有点复杂,我想知道是否有更简单/更有效的方法可以做到这一点。
indexes = [5,7,9]
indexes.insert(0,0)
indexes.append(df.index[-1]+1)
i = 0
df_list = []
while i+1 < len(indexes):
df_list.append(df.iloc[indexes[i]:indexes[i+1]])
i += 1
这一切都源于我试图回答这个问题。我相信有更好的方法来回答这个问题,但我确实觉得应该有一种更简单的方法来做这种切片,正如我所想的那样。
您可以像一样使用np.split
df_list = np.split(df, indexes)