我有一个pandas数据框架,其中包含从2013年到2016年的工资信息。每一行都描述了员工在一年中所赚的钱。它看起来像这样:
名称、年份、金额
"Bill Smith","2014","$20,000"
"John Jones","2014","$10,000"
"Bill Smith","2015","$21,000"
"John Jones","2015","$12,000"
"Sam Stone","2015","$15,000"
我需要过滤数据框以选择2014年以后被雇用的工人(例如,Sam Stone,但不包括Bill Smith或John Jones)。有什么建议吗?我的猜测是使用groupby(),然后尝试使用条件来过滤列表。
应该可以:
workers = df[df.Year<2015].Name.unique()
mew_workers_data = df[~df.Name.isin(workers)]