循环遍历一个csv文件,并使用这些值作为参数在另一个csv文件中查找记录



我有两个csv文件,看起来像这样:

表1:

tbody> <<tr>
ID紧急号码
1232
2343

您可以通过使用pandas package.来实现这一点。问题不够清楚,因此您可以将预期的输出放在那里。我不知道它是否给出了你期望的结果,但你可以试试这个:

import pandas as pd
file_one = pd.read_csv('CustomerFloat.csv')
file_two =  pd.read_csv('EKanbanOrderbook.csv')
final_data = file_two[(file_one['ID'].isin(file_two['ID']))]
print(final_data)

您可以使用pandas特性来比较而不是迭代文件,因为如果文件数据相加,则程序可能需要时间来处理。

您可以基于ID连接两个表,这两个表都是通用的:

table1 = pd.read_csv (r'CustomerFloat.csv')
table2 = pd.read_csv (r'EKanbanOrderbook.csv')
table2.merge(table1, on='ID')

默认情况下合并做一个内部连接how='inner',这意味着它只保留具有urgent number的行。如果你想要table2的所有行,你应该做一个左连接:

table2.merge(table1, on='ID', how='left')

在本例中,您将拥有来自table2的所有行,如果该行没有任何紧急号码,则为None。

之后,根据ID分组并循环遍历每个组,只填充urgent number的行。如果你提供部分数据集,我可以帮助你。

最新更新