在我的pandas数据框架中,我有一列,其中列的每一行都是一个具有重复值的列表。例如,具有3行的数据帧:df = pd.DataFrame({'Column_1': [[1,2,3,2],[1,1,2],[1,2,3]]})
我想删除重复项。我的预期输出类似于[[1,2,3],[1,2],[1,2,3]]
。如何应用集合函数来删除每个列表中的重复项?
提前感谢!
给定df
:
import pandas as pd
import numpy as np
df = pd.DataFrame({'Column_1': [[1,2,3,2],[1,1,2],[1,2,3]]})
尝试:
df.Column_1 = df.Column_1.apply(lambda r : list(set(r)))
或:
df.Column_1 = df.Column_1.apply(np.unique)
结果:
Column_1
0 [1, 2, 3]
1 [1, 2]
2 [1, 2, 3]