ID | CAR | TYPE|
---|---|---|
10 | Audi1 | F|
20 | BMW1 | nan |
50 | BMW2 | nan|
10 | Audi2 | nan |
30 | 马自达 | F[/tr>|
10 | Audi3 | >F |
20 | BMW3 | Z |
20 | BMW4 | F |
20 | BMW5 | A|
40 | KIA | G |
10 | Audi4 | A[/tr>|
10 | Audi5 | G |
10 | Audi6 | >nan |
循序渐进。删除列CAR
中的所有数字,并根据关键字进行筛选
df["mask"]=df["TYPE"].str.contains("F")
df=df.sort_values("mask", ascending=False).drop_duplicates(subset="ID", keep="first").drop(columns=["mask"])
print(df)
输出#测试
ID CAR TYPE
0 10 Audi1 F
4 30 mAZDA F
7 20 BMW4 F
9 40 kIA G
2 50 BMW2 NaN
>>>