我对Python Pandas和编程都很陌生。我有一个看起来像这样的数据帧(只是一个简化的例子(:
A B
0 name1 Dog, Dog, Cat
1 name2 Dog, Bird
2 name3 Cat, Cat, Cat
3 name4 Dog, Cat, Bird
我想删除每行上重复的值,所以我的DataFrame看起来像这样:
A B
0 name1 Dog, Cat
1 name2 Dog, Bird
2 name3 Cat
3 name4 Dog, Cat, Bird
我看到我可以用from collections import OrderedDict
做类似的事情,但正如我所说,我对编程还很陌生,我不知道如何做到这一点。如果你能帮我就太好了,谢谢!
使用apply
和join
:
df['B'] = df['B'].apply(lambda x: ', '.join(set(x.split(', '))))
print(df)
A B
0 name1 Dog, Cat
1 name2 Dog, Bird
2 name3 Cat
3 name4 Dog, Cat, Bird