将组索引器添加到熊猫数据框架中



我有一些看起来像这样的数据:

date_time, user, page
12345, A, index
13456, A, index
14566, B, home
...

我想存储每一行的索引(即按日期_time排序时的订单),无论是总体而言。

总体上很简单。只是:

df['overall_count'] = range(len(df))

,但我不知道如何在页面上做到这一点。以下代码可以使我想要的内容,但是它已连接到GroupBy对象,我不知道如何将其移至主要数据帧。

grouped = df.groupby('page')
for name, group in grouped:
    group = group.sort_values('date_time')
    group['page_count'] = range(len(group))

如果要分配小组索引,则可以使用cumcount:

df.groupby('page').cumcount()

相关内容

  • 没有找到相关文章

最新更新