我想在现有列的基础上添加一个索引列。重复项将共享同一索引。例如,
在此处输入图像描述
如果两列['old_index','year']的值相同,则新索引将相同。列"num"中的值无关紧要。
我想知道是否有人能帮忙。非常感谢!
df['new_id'] = df.groupby(df.columns.tolist(), sort=False).ngroup() + 1
df
index year id new_id
0 1 2000 5 1
1 2 1996 3 2
2 2 1996 3 2
3 4 1994 2 3
4 4 1999 4 4
5 4 1999 4 4
6 12 1989 1 5
7 12 1989 1 5
8 12 1985 0 6
9 12 2011 6 7
试试看,但如果它不完全是你想要的,请告诉我。