2000
450004400030007000800090007700075000100060009000
我有一个包含两个应用程序的每日下载量的数据框。但是每天我都有3个不同的下载数字:付费下载(最高值),自然下载(最小值)和其他(中间值)。
它们没有标记,所以我唯一知道的是,我需要对这三个值排序,然后得到中间的那个。原始数据集看起来像这样:
使用groupby
与nth
取第二个元素:
df.groupby(['id', 'date'], as_index=False).nth(1)