从与pandas中不同列的事件范围相关的列的总数中查找条件组的百分比



我有一个像这样的数据集:

我如何使用pandas找到在2021年首次雇用的员工在2022年被解雇的员工占总员工的百分比?

tbody> <<tr>
员工编号 事件日期 事件描述
1022021-10-12第一次雇佣
1032021-11-02第一次雇佣
1022022-01-01终止
1022021-12-12转变变化
1012021-12-03第一次雇佣
1032021-11-05终止
1012021-12-04终止
1052022-02-26第一次雇佣
1062022-02-26第一次雇佣
1022022-03-29第二雇佣
1072021-05-04第一次雇佣
1082022-04-04第一次雇佣
1092022-03-03终止
1092021-12-29第一次雇佣
1092022-04-01第二雇佣
1092022-01-10转变变化
# Convert Event Date to Timestamp if it's not Timestamp already
df["Event date"] = pd.to_datetime(df["Event date"])
# First hired in 2021
cond1 = df["Event date"].dt.year.eq(2021) & df["Event Description"].eq("First Hire")
# Terminated in 2022 & first hired in 2021
cond2 = (
df["Event date"].dt.year.eq(2022)
& df["Event Description"].eq("Terminated")
& df["employee No"].isin(df.loc[cond1, "employee No"])
)
df[cond2]

相关内容

  • 没有找到相关文章

最新更新