具有一个日期和三个不同值的数据框:我如何获得中间的那个?



我有一个包含两个应用程序的每日下载量的数据框。但是每天我都有3个不同的下载数字:付费下载(最高值),自然下载(最小值)和其他(中间值)。

它们没有标记,所以我唯一知道的是,我需要对这三个值排序,然后得到中间的那个。原始数据集看起来像这样:

2000 450004400030007000800090007700075000100060009000

使用groupbynth取第二个元素:

df.groupby(['id', 'date'], as_index=False).nth(1)

最新更新