有没有一种简单的方法可以手动循环访问现有的熊猫分组对象?



有没有一种简单的方法来手动遍历现有的pandasgroupby对象?

import pandas as pd
df = pd.DataFrame({'x': [0, 1, 2, 3, 4], 'category': ['A', 'A', 'B', 'B', 'B']})
grouped = df.groupby('category')

在应用程序中,for name, group in grouped:循环如下。对于手动测试,我想做一些类似group = grouped[0]的事情并在 for 循环中运行代码。不幸的是,这不起作用。我能找到的最好的东西(在这里)是

group = df[grouped.ngroup()==0]

它依赖于原始数据帧,而不是仅依赖于按对象分组,因此不是最佳 imo。

任何可迭代对象(此处为 GroupBy 对象)都可以转换为迭代器:

group_iter = iter(grouped)

下面的行相当于选择第一个组(按0索引):

name, group = next(group_iter)

要获取下一组,只需重复:

name, group = next(group_iter)

等等...


来源: https://treyhunner.com/2018/02/python-range-is-not-an-iterator/

相关内容

  • 没有找到相关文章

最新更新