Pandas-为每个实例选择最大值

我有一个Python熊猫数据帧，看起来像这样：

df = pd.DataFrame({'LATITUDE': [-22.22, -22.43, -22.22, -22.43, -22.35, -22.35, -22.35, -22.21]})
df['Importance'] = df.groupby('LATITUDE').cumcount().add(1)
df

如何生成另一个只有每个实例的最大值的数据帧？

输出示例：

LATITUDE | Importance
-22.22   | 2
-22.43   | 2
-22.35   | 3
-22.21   | 1

这就是你想要的吗？老实说，我对你的"重要性"专栏有点困惑。这是数据集的一部分，还是试图解决您的问题？不管怎样，我已经把它作为数据集的一部分。。。

import pandas as pd
df = pd.DataFrame({'LATITUDE': [-22.22, -22.43, -22.22, -22.43, 
-22.35, -22.35, -22.35, -22.21]})
df['Importance'] = df.groupby('LATITUDE').cumcount().add(1)
# Return the LATITUDE and Importance with max Importance.
df2 = df.groupby('LATITUDE', as_index=False).agg({'Importance': max})

之前：

LATITUDE  Importance
0    -22.22           1
1    -22.43           1
2    -22.22           2
3    -22.43           2
4    -22.35           1
5    -22.35           2
6    -22.35           3
7    -22.21           1

之后：

LATITUDE  Importance
0    -22.43           2
1    -22.35           3
2    -22.22           2
3    -22.21           1

如果你在追求别的东西，请告诉我。。。

df.groupby('LATITUDE', as_index=False).max()

之前：

之后：

相关内容

最新更新

热门标签：