我正在尝试比较一个有2列的CSV文件,第一列有1500个值,第二列有900个值。
示例:
ValueA ValueB
ValueB ValueC
ValueD ValueA
Valuec ValueD
ValueF
ValueG
ValueH
ValueZ
输出逻辑是从第一列中取一个值,并将其与第二列中的所有值进行比较:
- 如果有匹配,什么也不做
- 如果不匹配,则将该值输出到名为results.csv的文件中
我对编程很陌生,我一直在寻找这个特定逻辑的网站,但没有找到。
非常感谢在这方面的任何帮助。提前谢谢。
首先,最好的方法是使用内置的Python CSV库将所有内容加载到两个不同的数组中,如下所示:
import csv
leftCol = []
rightCol = []
with open('example.csv') as csvFile:
reader = csv.reader(csvFile)
for row in reader:
if len(row) > 0:
leftCol.append(row[0])
if len(row) > 1:
rightCol.append(row[1])
然后将这两列存储在漂亮的数组中,leftCol和rightCol。然后进行比较:
for leftItem in leftCol:
for rightItem in rightCol:
if leftItem != rightItem:
print(leftItem)
在这种情况下,它只是打印它,但您可以将打印换成文件写入或其他内容。