2022-10-232022-12-25
我已经得到了这个示例数据框架。每次使用有2行。
它们有到达和离开日期,其中一个总是None。日期为字符串。
这是我的数据当前的样子:
将None
替换为pd.NaT
,然后在traveller_id
分组后再与max
进行agg:
df.replace({None:pd.NaT}).groupby('traveller_id', as_index=False).agg(max)
在构造函数中的输出:
traveller_id arrival departure
0 170884 2022-12-22 2022-12-25
1 712311 2022-10-20 2022-10-23
我假设字符串是日期。如果它们是字符串,是的,您可以先将它们转换为日期,而不需要将None
替换为pd.NaT
。
因此:
df['arrival'] = pd.to_datetime(df['arrival'])
df['departure'] = pd.to_datetime(df['departure'])
df = df.groupby('traveller_id', as_index=False).agg(max)