如果一行中有多个关键字,是否有可能分离关键字。事实上,这是一项了解品牌知名度的调查数据。
例如,如果我有这样的df:
df
ID Brand
1 BMW
2 VW-BMW-Audi
3 Audi
4 Mercedes-Audi
我想要的输出是这样的:
ID Brand
1 BMW
2 VW
2 BMW
2 Audi
3 Audi
4 Mercedes
4 Audi
所以我希望id
对于出现在同一行的所有关键字保持不变,正如您在所需输出中看到的那样。
尝试以下操作:
df = df.assign(Brand = df.Brand.str.split('-')).explode('Brand')
print(df)
ID Brand
0 1 BMW
1 2 VW
1 2 BMW
1 2 Audi
2 3 Audi
3 4 Mercedes
3 4 Audi
您可以尝试
df["Brand"] = df["Brand"].apply(lambda x: x.split("-"))
print(df.explode("Brand"))