如何将set函数应用于特定列的所有行,这些行的条目是具有重复值的列表

  • 本文关键字:列表 应用于 函数 set python pandas
  • 更新时间 :
  • 英文 :


在我的pandas数据框架中,我有一列,其中列的每一行都是一个具有重复值的列表。例如,具有3行的数据帧:df = pd.DataFrame({'Column_1': [[1,2,3,2],[1,1,2],[1,2,3]]})我想删除重复项。我的预期输出类似于[[1,2,3],[1,2],[1,2,3]]。如何应用集合函数来删除每个列表中的重复项?

提前感谢!

给定df:

import pandas as pd
import numpy as np
df = pd.DataFrame({'Column_1': [[1,2,3,2],[1,1,2],[1,2,3]]})

尝试:

df.Column_1 = df.Column_1.apply(lambda r : list(set(r))) 

或:

df.Column_1 = df.Column_1.apply(np.unique)

结果:

Column_1
0  [1, 2, 3]
1     [1, 2]
2  [1, 2, 3]

最新更新