通过对每个唯一的用户进行分组并为每个唯一的日期添加访问号列,对数据框进行排序和排序



我对Python相当陌生,我正在尝试从我的数据框架中添加用户列表中的访问号列。

我有一个由'UserID'列指定的55个唯一用户的数据帧和一个由'dateStarted'指示的日期时间列我想创建一个列,为每个用户和每个唯一的日期有一个访问号码。该数据框看起来应该像:

UserID dateStarted  visit
0      a    01/01/10      1
1      a    01/01/10      1
2      a    01/04/10      2
3      b    06/02/08      1
4      b    07/15/12      2
5      c    02/12/12      1
6      d    02/12/12      1

UserIDrankdateStarted中的值分组,赋序数

df['visit'] = df.groupby('UserID')['dateStarted'].rank(method='dense').astype(int)

UserID dateStarted  visit
0      a    01/01/10      1
1      a    01/01/10      1
2      a    01/04/10      2
3      b    06/02/08      1
4      b    07/15/12      2
5      c    02/12/12      1
6      d    02/12/12      1

相关内容

  • 没有找到相关文章

最新更新