Pandas-为每个实例选择最大值



我有一个Python熊猫数据帧,看起来像这样:

df = pd.DataFrame({'LATITUDE': [-22.22, -22.43, -22.22, -22.43, -22.35, -22.35, -22.35, -22.21]})
df['Importance'] = df.groupby('LATITUDE').cumcount().add(1)
df

如何生成另一个只有每个实例的最大值的数据帧?

输出示例:

LATITUDE | Importance
-22.22   | 2
-22.43   | 2
-22.35   | 3
-22.21   | 1

这就是你想要的吗?老实说,我对你的"重要性"专栏有点困惑。这是数据集的一部分,还是试图解决您的问题?不管怎样,我已经把它作为数据集的一部分。。。

import pandas as pd
df = pd.DataFrame({'LATITUDE': [-22.22, -22.43, -22.22, -22.43, 
-22.35, -22.35, -22.35, -22.21]})
df['Importance'] = df.groupby('LATITUDE').cumcount().add(1)
# Return the LATITUDE and Importance with max Importance.
df2 = df.groupby('LATITUDE', as_index=False).agg({'Importance': max})

之前:

LATITUDE  Importance
0    -22.22           1
1    -22.43           1
2    -22.22           2
3    -22.43           2
4    -22.35           1
5    -22.35           2
6    -22.35           3
7    -22.21           1

之后:

LATITUDE  Importance
0    -22.43           2
1    -22.35           3
2    -22.22           2
3    -22.21           1

如果你在追求别的东西,请告诉我。。。

df.groupby('LATITUDE', as_index=False).max()

最新更新