删除Pandas中同一行中重复的单词

我对Python Pandas和编程都很陌生。我有一个看起来像这样的数据帧(只是一个简化的例子(：

A      B  
0  name1  Dog, Dog, Cat
1  name2  Dog, Bird
2  name3  Cat, Cat, Cat
3  name4  Dog, Cat, Bird

我想删除每行上重复的值，所以我的DataFrame看起来像这样：

A      B  
0  name1  Dog, Cat
1  name2  Dog, Bird
2  name3  Cat
3  name4  Dog, Cat, Bird

我看到我可以用from collections import OrderedDict做类似的事情，但正如我所说，我对编程还很陌生，我不知道如何做到这一点。如果你能帮我就太好了，谢谢！

使用apply和join:

df['B'] = df['B'].apply(lambda x: ', '.join(set(x.split(', '))))
print(df)
A               B
0  name1        Dog, Cat
1  name2       Dog, Bird
2  name3             Cat
3  name4  Dog, Cat, Bird

相关内容

最新更新

热门标签：