我对Python相当陌生,我正在尝试从我的数据框架中添加用户列表中的访问号列。
我有一个由'UserID'列指定的55个唯一用户的数据帧和一个由'dateStarted'指示的日期时间列我想创建一个列,为每个用户和每个唯一的日期有一个访问号码。该数据框看起来应该像:
UserID dateStarted visit
0 a 01/01/10 1
1 a 01/01/10 1
2 a 01/04/10 2
3 b 06/02/08 1
4 b 07/15/12 2
5 c 02/12/12 1
6 d 02/12/12 1
将UserID
和rank
与dateStarted
中的值分组,赋序数
df['visit'] = df.groupby('UserID')['dateStarted'].rank(method='dense').astype(int)
UserID dateStarted visit
0 a 01/01/10 1
1 a 01/01/10 1
2 a 01/04/10 2
3 b 06/02/08 1
4 b 07/15/12 2
5 c 02/12/12 1
6 d 02/12/12 1