我有一个Python熊猫数据帧,看起来像这样:
df = pd.DataFrame({'LATITUDE': [-22.22, -22.43, -22.22, -22.43, -22.35, -22.35, -22.35, -22.21]})
df['Importance'] = df.groupby('LATITUDE').cumcount().add(1)
df
如何生成另一个只有每个实例的最大值的数据帧?
输出示例:
LATITUDE | Importance
-22.22 | 2
-22.43 | 2
-22.35 | 3
-22.21 | 1
这就是你想要的吗?老实说,我对你的"重要性"专栏有点困惑。这是数据集的一部分,还是试图解决您的问题?不管怎样,我已经把它作为数据集的一部分。。。
import pandas as pd
df = pd.DataFrame({'LATITUDE': [-22.22, -22.43, -22.22, -22.43,
-22.35, -22.35, -22.35, -22.21]})
df['Importance'] = df.groupby('LATITUDE').cumcount().add(1)
# Return the LATITUDE and Importance with max Importance.
df2 = df.groupby('LATITUDE', as_index=False).agg({'Importance': max})
之前:
LATITUDE Importance
0 -22.22 1
1 -22.43 1
2 -22.22 2
3 -22.43 2
4 -22.35 1
5 -22.35 2
6 -22.35 3
7 -22.21 1
之后:
LATITUDE Importance
0 -22.43 2
1 -22.35 3
2 -22.22 2
3 -22.21 1
如果你在追求别的东西,请告诉我。。。
df.groupby('LATITUDE', as_index=False).max()