如何比较pandas中两个CSV文件的内容并发现差异?



我有两个CSV文件。一个包含完整的名字列表,另一个包含一些名字,每个名字都在一个名为"Name"的列中。

类似:

a.csv

Name
John
Robert
Ben
Frank
Felix

b.csv

Name
John
Robert
Ben
Frank

请注意,第二个列表中没有Felix。

我想阅读这两个CSV文件,并确定差异,即Frank在第二个列表中缺失。我遇到了下面的例子,它做了我喜欢的事情,但很难应用到我的例子中。

from collections import Counter
target_list = ["one", "two", "three", "four", "five"]
output_list = ['two','three','four', 'five']
Counter(target_list)-Counter(output_list)
>>> df1
Name
0    John
1  Robert
2     Ben
3   Frank
4   Felix
>>> df2
Name
0    John
1  Robert
2     Ben
3   Frank
>>> df1[~df1.Name.isin(df2.Name)]
Name
4  Felix

最新更新