最常和最不常见的数字和异常值 - Jupyter


id |car_id
0  |  32
.  |   2
.  |   3
.  |   7
.  |   3
.  |   4
.  |  32
N  |   1

您如何从id_car列中选择最频繁和最不常用的数字,并将它们显示在新表格中,就像它经常出现的那样?car_id"和"数量">

mdata['car_id'].value_counts().idxmax()

下面是一些代码,它将提供最常用的 ID 和三个最不常用的 ID。

from collections import Counter
car_ids = [32, 2, 3, 7, 3, 4, 32, 1]
c = Counter(car_ids)
count_pairs = c.most_common() # Gets all counts, from highest to lowest.
print (f'Most frequent: {count_pairs[0]}') # Most frequent: (32, 2)
n = 3
print (f'Least frequent {n}: {count_pairs[:-n-1:-1]}') # Least frequent 3: [(1, 1), (4, 1), (7, 1)]

count_pairs有一个 (ID,该 ID 的计数(对的列表。它按从最频繁到最不频繁的顺序排序。most_common没有告诉我们领带的顺序。

如果您只需要任何最不常用的 ID,则可以将 n 更改为 1。我把它定为3,以便你可以看到三个并列最不频繁。

相关内容

  • 没有找到相关文章

最新更新