Column1 Column2
A B
B C
C C
E E
这里第三行和第四行相等,C和C,E和E。输出应该是C和E。
首先,导入带有panda的文件。
import pandas as pd
df = pd.read_csv('your_file')
然后,只需按照以下方式进行比较并打印:
matched_values = df['Column1'][df['Column1']==df['Column2']].values
print(matched_values)
首先使用pandas
:获取数据
>>> import pandas as pd
>>> df = pd.read_csv('path/to/file.csv')
我将用一个玩具DataFrame
来说明:
>>> df = pd.DataFrame({'a': [1,2,3,4], 'b':[0,2,3,0]})
然后,您所要做的就是进行适当的查询,选择其中一列,并通过多种方式获得结果。我正在使用.values
获取numpy
列表:
>>> df.query('`Column 1` == `Column 2`')['Column 1'].values
array([2, 3])
您可以使用.tolist()
来获得一个普通的python
列表。