我有2个熊猫数据框架,每一个都有一个列('id')如下所示,id列也可能有重复。df1:
id
1
2
3
4
5
df2:
id
1
2
3
输出:id
4
5
我正在阅读2个文件,我无法使用合并实现所需的输出。如有任何帮助,不胜感激。
import pandas as pd
colnames = ['id']
df1 = pd.read_csv(r'file1.csv', names=colnames)
df2 = pd.read_csv(r'file2.csv', names=colnames)
###df = df1.merge(df2, how='right')
您可以使用set
:
>>> set(df1['id']) - set(df2['id'])
{4, 5}
>>>
或:
>>> df1.loc[~df1['id'].isin(df2['id'])]
id
3 4
4 5
>>>