Python熊猫:在现有列的基础上添加索引列,重复列共享同一索引



我想在现有列的基础上添加一个索引列。重复项将共享同一索引。例如,

在此处输入图像描述

如果两列['old_index','year']的值相同,则新索引将相同。列"num"中的值无关紧要。

我想知道是否有人能帮忙。非常感谢!


df['new_id'] = df.groupby(df.columns.tolist(), sort=False).ngroup() + 1
df

index   year    id  new_id
0   1   2000    5   1
1   2   1996    3   2
2   2   1996    3   2
3   4   1994    2   3
4   4   1999    4   4
5   4   1999    4   4
6   12  1989    1   5
7   12  1989    1   5
8   12  1985    0   6
9   12  2011    6   7

试试看,但如果它不完全是你想要的,请告诉我。

最新更新