有没有一种简单的方法来手动遍历现有的pandas
groupby
对象?
import pandas as pd
df = pd.DataFrame({'x': [0, 1, 2, 3, 4], 'category': ['A', 'A', 'B', 'B', 'B']})
grouped = df.groupby('category')
在应用程序中,for name, group in grouped:
循环如下。对于手动测试,我想做一些类似group = grouped[0]
的事情并在 for 循环中运行代码。不幸的是,这不起作用。我能找到的最好的东西(在这里)是
group = df[grouped.ngroup()==0]
它依赖于原始数据帧,而不是仅依赖于按对象分组,因此不是最佳 imo。
任何可迭代对象(此处为 GroupBy 对象)都可以转换为迭代器:
group_iter = iter(grouped)
下面的行相当于选择第一个组(按0
索引):
name, group = next(group_iter)
要获取下一组,只需重复:
name, group = next(group_iter)
等等...
来源: https://treyhunner.com/2018/02/python-range-is-not-an-iterator/