什么是熊猫等价物排序 foo |uniq -c(以及如何将计数列标记为"计数")?



我花了很多小时试图解决这个问题,终于找到了答案,但并没有完全找到。我还没有找到一个完全符合我要求的例子,但这似乎是一件非常简单的事情

df = pd.DataFrame({'Name': ["A", "B", "C", "A"],
'ID': [1, 2, 3, 1]})

print("ndf")
print(df)

发射

Name  ID
0    A   1
1    B   2
2    C   3
3    A   1

我能做些什么来得到这个输出?

Name  ID Count
A   1     2
B   2     1
C   3     1

以下答案应该会对您有所帮助:

import pandas as pd

df = pd.DataFrame({'Name': ["A", "B", "C", "A"],
'ID': [1, 2, 3, 1]})
df = df.groupby(["Name", "ID"])["Name"].count().reset_index(name="Count")
print(df)

输出:

Name  ID  Count
0    A   1      2
1    B   2      1
2    C   3      1
df.groupby(['Name', 'ID']).size().reset_index().rename(columns={0:'COUNT'})

最新更新