如何通过减去另一个电子表格的重复来创建新的excel电子表格



我有两个excel电子表格。Test1 Test2。Test1有user1、user2、user3,等等。Test2有user1、user2和user5。我想从Test1中删除user1、user2和user5。

这是一个例子。长话短说。我有两个excel电子表格拉数据。一个是自动生成的另一个是我做的。我想从已制作的电子表格中删除用户,并创建一个新的电子表格,该电子表格在删除Test2上列出的用户后仅显示Test1中的用户。

我正在使用python和pandas,但没有找到解决这个问题的方法。

到目前为止,我一直在做关于蟒蛇和熊猫的研究。我最初的解决方案是每周手动删除用户,以创建一个新的电子表格。

如果我理解正确?

import pandas as pd

path = "/path/to/files/"
test1 = pd.read_excel(f"{path}Test1.xlsx")
users2 = pd.read_excel(f"{path}Test2.xlsx").users.unique()
users1 = test1.users.unique()
user_intersection = set(users1).intersection(users2)
test1.query("~users.isin(@user_intersection)").reset_index(drop=True).to_excel(f"{path}/Test3.xlsx", index=False)

最新更新