Manufacturer Buy Box Seller
0 Goli Goli Nutrition Inc.
1 Hanes 3rd Street Brands
2 NaN Inspiring Life
3 Sports Research Sports Research
4 Beckham Luxury Linen Thalestris Co.
你好,我正在使用pandas DataFrame来清理这个文件,并希望删除购买框卖家列中包含制造商名称的行。例如,第1行将被删除,因为它包含Buy-Box seller列中的字符串"Goli"。
存在错误值,因此首先用DataFrame.fillna
替换它们,然后测试DataFrame.apply
中not in statement
与axis=1
中的列之间的值是否匹配,并在boolean indexing
:中进行筛选
mask = (df.fillna('Missing vals')
.apply(lambda x: x['Manufacturer'] not in x['Buy Box Seller'], axis=1))
df = df[mask]