计算excel文件(python)中的电子邮件



我有一个excel文件,其中包括许多电子邮件,其中一些是多次编写的。我需要数一下这些电子邮件重复了多少次。我如何使用python来做到这一点?

假设所有电子邮件都在一个"干净";格式(不是一个有拼写错误、额外空格等的自由文本字段(。

import pandas as pd
df = pd.DataFrame([
['add1','val1'],
['add2','val2'],
['add3','val3'],
['add1','val4']
],columns=['Address','Value'])

df.groupby('Address').count()
Value
Address       
add1         2
add2         1
add3         1

DataFrame除了要分组的内容之外,还需要有列。

df = pd.DataFrame([['add1'],['add2'],['add3'],['add1']],columns=['Address'])
df.groupby('Address').count()
Empty DataFrame
Columns: []
Index: [add1, add2, add3]

您可以通过以下方式进行分组:https://pandas.pydata.org/docs/reference/groupby.html

如何使用groupby:https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.groupby.html?highlight=groupby#pandas.DataFrame.groupby

最新更新