我是熊猫的新手。
我有一个数据框,我想按用户分组,然后在其速度列中找到最低的分数。
所以我不能只使用 df.groupby(['user'])['speed'].transform('min)
,因为这将使所有值的最小值不仅仅是将当前行形成第一个。
我可以用什么来获得我需要的东西?
而没有看到您的数据集,很难直接帮助您。问题确实归结为以下内容。您需要选择要使用的数据范围(因此,在日期范围内选择行和用户/速度的列)。
看起来像x = df.loc[["2-4-2018","2-4-2019"], ['users', 'speed']]
从那里,您可以为该值进行简单的x['users'].min()
或值的x['users'].idxmin()
。
我还没有玩过DataFrames,但是您正在寻找如何 slice dataframes。