Pandas基于列中相同的字符串删除行


Manufacturer               Buy Box Seller
0   Goli                   Goli Nutrition Inc.
1   Hanes                  3rd Street Brands
2   NaN                    Inspiring Life
3   Sports Research        Sports Research
4   Beckham Luxury Linen   Thalestris Co.

你好,我正在使用pandas DataFrame来清理这个文件,并希望删除购买框卖家列中包含制造商名称的行。例如,第1行将被删除,因为它包含Buy-Box seller列中的字符串"Goli"。

存在错误值,因此首先用DataFrame.fillna替换它们,然后测试DataFrame.applynot in statementaxis=1中的列之间的值是否匹配,并在boolean indexing:中进行筛选

mask = (df.fillna('Missing vals')
.apply(lambda x: x['Manufacturer'] not in x['Buy Box Seller'], axis=1))
df = df[mask]

相关内容

  • 没有找到相关文章

最新更新