我有两个CSV文件。一个包含完整的名字列表,另一个包含一些名字,每个名字都在一个名为"Name"的列中。
类似:
a.csv
Name
John
Robert
Ben
Frank
Felix
b.csv
Name
John
Robert
Ben
Frank
请注意,第二个列表中没有Felix。
我想阅读这两个CSV文件,并确定差异,即Frank在第二个列表中缺失。我遇到了下面的例子,它做了我喜欢的事情,但很难应用到我的例子中。
from collections import Counter
target_list = ["one", "two", "three", "four", "five"]
output_list = ['two','three','four', 'five']
Counter(target_list)-Counter(output_list)
>>> df1
Name
0 John
1 Robert
2 Ben
3 Frank
4 Felix
>>> df2
Name
0 John
1 Robert
2 Ben
3 Frank
>>> df1[~df1.Name.isin(df2.Name)]
Name
4 Felix