循环遍历一个csv文件，并使用这些值作为参数在另一个csv文件中查找记录

我有两个csv文件，看起来像这样:

表1:

tbody> <<tr>

ID	紧急号码
123	2
234	3

您可以通过使用pandas package.来实现这一点。问题不够清楚，因此您可以将预期的输出放在那里。我不知道它是否给出了你期望的结果，但你可以试试这个:

import pandas as pd
file_one = pd.read_csv('CustomerFloat.csv')
file_two =  pd.read_csv('EKanbanOrderbook.csv')
final_data = file_two[(file_one['ID'].isin(file_two['ID']))]
print(final_data)

您可以使用pandas特性来比较而不是迭代文件，因为如果文件数据相加，则程序可能需要时间来处理。

您可以基于ID连接两个表，这两个表都是通用的:

table1 = pd.read_csv (r'CustomerFloat.csv')
table2 = pd.read_csv (r'EKanbanOrderbook.csv')
table2.merge(table1, on='ID')

默认情况下合并做一个内部连接how='inner'，这意味着它只保留具有urgent number的行。如果你想要table2的所有行，你应该做一个左连接:

table2.merge(table1, on='ID', how='left')

在本例中，您将拥有来自table2的所有行，如果该行没有任何紧急号码，则为None。

之后，根据ID分组并循环遍历每个组，只填充urgent number的行。如果你提供部分数据集，我可以帮助你。

相关内容

最新更新

热门标签：