我有一些看起来像这样的数据:
date_time, user, page
12345, A, index
13456, A, index
14566, B, home
...
我想存储每一行的索引(即按日期_time排序时的订单),无论是总体而言。
。总体上很简单。只是:
df['overall_count'] = range(len(df))
,但我不知道如何在页面上做到这一点。以下代码可以使我想要的内容,但是它已连接到GroupBy对象,我不知道如何将其移至主要数据帧。
grouped = df.groupby('page')
for name, group in grouped:
group = group.sort_values('date_time')
group['page_count'] = range(len(group))
如果要分配小组索引,则可以使用cumcount:
df.groupby('page').cumcount()