选择panda中三列中具有匹配值的行

我正在尝试提取具有三个匹配列的行：员工、新日期和原始日期。我需要查看员工是否在同一日期有多个更改(行(。

输入：

新日期原始日期空

您可能需要了解；pandasql"；图书馆它允许您使用SQL代码来操作数据。在这里，熊猫的数据帧将是表。

import pandasql as psql
result = psql.sqldf('''
SELECT *
FROM df''')

试试这个：

df = df[~df.duplicated(subset=['EmployeeName','NewDate','OriginalDate'], keep='first')]

有关详细信息，请参阅此链接https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.duplicated.html

相关内容