我遇到了一个问题,因为map((不允许我映射重复的值。情况是这样的。
我有这个每日观察的df1
Obvserved_Today A B
0 192.168.1.1 3 2
1 192.168.1.3 1 3
2 192.168.1.4 1 5
3 192.168.1.5 2 9
我想通过添加两列历史数据来更新df,所以我已经有了历史的第二个数据帧df2
IP_Historical Ticket Date
0 192.168.1.1 3001 11/01/2020
1 192.168.1.1 3002 11/02/2020
2 192.168.1.3 3003 11/03/2020
3 192.168.1.5 3004 11/04/2020
4 192.168.1.5 3005 11/05/2020
我想要一个像下面这样的输出,我想再添加两列,第一列包含历史df2中看到的最后一个票证,第二列也来自历史df2,如果没有匹配,则最后一个看到的日期为NaN或0。
Obvserved_Today A B Last Ticket Last update
0 192.168.1.1 3 2 3002 11/02/2020
1 192.168.1.3 1 3 3003 11/03/2020
2 192.168.1.4 1 5 0 0
3 192.168.1.5 2 9 3005 11/05/2020
df1.merge(df2[~df2.duplicated('Obvserved_Today',keep='last')], how='left', on='Obvserved_Today')
这将具有名为";门票";而不是";最后一张票";以及";日期";而不是";最后更新";。如果需要,可以在合并后重命名。
这个代码在做什么
它正在合并两个数据帧(查看on=
列并匹配相同的值(,但只查看第二个数据帧中最后一个观察到的行。