团队,我有一个简单的数据框架,有2列(Datetime,Duration),需要找到每天的最大Datetime值上的Duration值。以下是数据帧的示例数据
starttime Duartion
2021-07-17 03:30:00 1234
2021-07-17 07:30:00 498
2021-07-18 03:30:00 1700
2021-07-18 07:40:00 2185
o/p
starttime Duartion
2021-07-17 07:30:00 498
2021-07-18 07:40:00 2185
请帮忙。
先决条件,使用datetime
类型表示";starttime":
df['starttime'] = pd.to_datetime(df['starttime'])
如果";"开始时间";值已排序:
df.groupby(df['starttime'].dt.normalize(), as_index=False).last()
其他:
df.loc[df.groupby(df['starttime'].dt.normalize())['starttime'].idxmax().values]
这将取每天的最大值:
df.set_index('starttime').resample('1D').max()