python3单列数据框比较



我有2个熊猫数据框架,每一个都有一个列('id')如下所示,id列也可能有重复。df1:

id

1
2
3
4
5

df2:

id

1
2
3

输出:id

4
5

我正在阅读2个文件,我无法使用合并实现所需的输出。如有任何帮助,不胜感激。

import pandas as pd
colnames = ['id']
df1 = pd.read_csv(r'file1.csv', names=colnames)
df2 = pd.read_csv(r'file2.csv', names=colnames)
###df = df1.merge(df2, how='right')

您可以使用set:

>>> set(df1['id']) - set(df2['id'])
{4, 5}
>>> 

或:

>>> df1.loc[~df1['id'].isin(df2['id'])]
id
3   4
4   5
>>> 

最新更新