我有数据集,
ID Date
1 12/12/2020 13:00
1 12/12/2020 14:00
1 12/12/2020 15:00
1 12/12/2020 16:00
2 12/13/2020 13:00
2 12/13/2020 13:15
2 12/13/2020 14:00
2 12/13/2020 14:30
预期输出,
ID TimeDelta
1 120mins
2 45mins
我需要为每个GROUPBY找到(第1行和第2行),(第3行和第4行)等之间的时差,然后添加差异
一种方法是枚举行,然后透视:
enum = df.groupby('ID').cumcount()
df['col'] = enum % 2
df['row'] = enum //2
tmp = df.pivot_table(index=['ID','row'], columns='col',
values='Date', aggfunc='first')
tmp[1].sub(tmp[0]).sum(level=0)
输出:
ID
1 0 days 02:00:00
2 0 days 00:45:00
dtype: timedelta64[ns]