我正试图写一段代码,用python打开一个CSV文件,并解析每一行和每一行中的每个元素。然后查看每个元素是否在另一个CSV文件中,是否将其写入第三个文件。这是我目前的代码,通过测试我已经确定我的搜索算法是不正确的。。。
import csv
def generateKnownReport(mypath, GKR):
if GKR==True:
report = open("KnownReport.txt", "w")
file2=frozenset(open("file","r"))
for row in csv.reader(open("file","r"),delimiter=','):
for item in row:
if item in file2:
##report.write(str(row))
print('True')
break
else:
print('ERROR')
report.close()
else:
report = open("KnownReport.txt", "w")
report.write("No Known Report Generated.")
report.close()
任何帮助都将不胜感激。谢谢
您的问题是if item in file2:
。你打开了file2
,但没有处理它。in
不会为你实现搜索。在搜索item
之前,您至少需要加载file2。
唯一合理的方法是将这两个文件读取到列表或其他可迭代文件中,然后逐步查找差异。
如果重复项不重要,则一个集合将提供更好的性能。
以下是开始的方法:
with open('file-one.csv') as f:
reader = csv.reader(f, delimiter=',') # adjust accordingly
file_one = list(reader)
with open('file-two.csv') as f:
reader = csv.reader(f, delimiter=',')
file_two = list(reader)
element_to_search = 0 # 0 = first column in the row
line_pairs = zip(file_one, file_two)
with open('file-three.csv','w') as f:
for line in line_pairs:
if line[0][element_to_search] == line[1][element_to_search]:
f.write('{}n'.format(line[0]))