使用Python识别A列中的值,而不是B列和C列中的



Python新手寻求帮助。一个数据集有3个数字列:A、B、C。如何找到只存在于A而不存在于B和C中的值?

您的问题需要更多详细信息,但您可以调整以下代码:

A = [1, 2, 3]
B = [1, 3, 4]
C = [1, 4, 5]
>>> set(A).difference(set(B).union(C))
{2}

如果数据集是CSV或.xlsx,则可以使用panda进行处理。

import pandas as pd

df = pd.read_csv('path/to/file') # if file is csv
# if file is xlsx
# df = pd.read_xlsx('path/to/file')
a = df['A'].unique()
b = df['B'].unique()
c = df['C'].unique()
diff = set(a).difference(set(b).union(c))

最新更新