比较CSV文件中的两列以进行相等性检查

  • 本文关键字:两列 文件 CSV 比较 python
  • 更新时间 :
  • 英文 :

Column1 Column2
A         B
B         C
C         C
E         E

这里第三行和第四行相等,C和C,E和E。输出应该是C和E。

首先,导入带有panda的文件。

import pandas as pd
df = pd.read_csv('your_file')

然后,只需按照以下方式进行比较并打印:

matched_values = df['Column1'][df['Column1']==df['Column2']].values
print(matched_values)

首先使用pandas:获取数据

>>> import pandas as pd
>>> df = pd.read_csv('path/to/file.csv')

我将用一个玩具DataFrame来说明:

>>> df = pd.DataFrame({'a': [1,2,3,4], 'b':[0,2,3,0]})

然后,您所要做的就是进行适当的查询,选择其中一列,并通过多种方式获得结果。我正在使用.values获取numpy列表:

>>> df.query('`Column 1` == `Column 2`')['Column 1'].values
array([2, 3])

您可以使用.tolist()来获得一个普通的python列表。

最新更新