如果有任何重复或基于子集['Column Name']的值为空,我希望删除这些行
输入数据:
Col1 Col2
AZBC11 Ayz Ltd
APNK22 EXL Ltd
AZBC11 Ayz Ltd
Vmware Inc
By25NZ UHG Inc
NH55KJ AON Interprise
预期输出:
Col1 Col2
AZBC11 Ayz Ltd
APNK22 EXL Ltd
By25NZ UHG Inc
NH55KJ AON Interprise
脚本一直在使用:
df = df.drop_duplicates(subset=['col1'])
使用上面的脚本,我可以删除重复的行,但我如何更新上面的行,以便在出现重复或空白的情况下删除基于col1的行
print(df[df["Col1"] != ""].drop_duplicates(subset=["Col1"]))
打印:
Col1 Col2
0 AZBC11 Ayz Ltd
1 APNK22 EXL Ltd
4 By25NZ UHG Inc
5 NH55KJ AON Interprise