这是每个日期有多个值的数据帧,但我只想要每个日期的最大Data_value。 请注意,此数据跨度为 2005-2014 年。
ID Date Element Data_Value
49030 USC00207312 2005-01-01 TMAX 150
55424 USC00207308 2005-01-01 TMAX 150
18261 USC00205050 2005-01-01 TMAX 56
18049 USW00014853 2005-01-01 TMAX 56
60994 USW00004848 2005-01-01 TMAX 133
31715 USC00205451 2005-01-01 TMAX 156
尝试将 groupby 与 idxmax 和布尔索引一起使用:
df.loc[df.groupby('Date')['Data_Value'].idxmax()]
输出:
ID Date Element Data_Value
31715 USC00205451 2005-01-01 TMAX 156