如何读取一个文件,然后从该文件中提取每个元素,并搜索另一个文件以查看它是否包含该元素.Python



我正试图写一段代码,用python打开一个CSV文件,并解析每一行和每一行中的每个元素。然后查看每个元素是否在另一个CSV文件中,是否将其写入第三个文件。这是我目前的代码,通过测试我已经确定我的搜索算法是不正确的。。。

import csv
def generateKnownReport(mypath, GKR):
if GKR==True:
report = open("KnownReport.txt", "w")
file2=frozenset(open("file","r"))
for row in csv.reader(open("file","r"),delimiter=','):
for item in row:
if item in file2:
##report.write(str(row))
print('True')
break
else:
print('ERROR')
report.close() 
else:
report = open("KnownReport.txt", "w")
report.write("No Known Report Generated.")
report.close()

任何帮助都将不胜感激。谢谢

您的问题是if item in file2:。你打开了file2,但没有处理它。in不会为你实现搜索。在搜索item之前,您至少需要加载file2。

唯一合理的方法是将这两个文件读取到列表或其他可迭代文件中,然后逐步查找差异。

如果重复项不重要,则一个集合将提供更好的性能。

以下是开始的方法:

with open('file-one.csv') as f:
reader = csv.reader(f, delimiter=',')  # adjust accordingly
file_one = list(reader)
with open('file-two.csv') as f:
reader = csv.reader(f, delimiter=',')
file_two = list(reader)
element_to_search = 0  # 0 = first column in the row
line_pairs = zip(file_one, file_two)
with open('file-three.csv','w') as f:
for line in line_pairs:
if line[0][element_to_search] == line[1][element_to_search]:
f.write('{}n'.format(line[0]))

最新更新