using set() with pandas



请问我们是否可以使用set()读取pandas中特定列的数据?例如,我从DataFrame df1得到以下输出:

df1= [    
0 -10 2 5 
1  24 5 10 
2  30 3 6 
3  30 2 1 
4  30 4 5
]

,其中第一列是索引。我首先尝试隔离第二列

[-10 
24 
30 
30 
30] 

使用如下:x = pd.DataFrame(df1, coulmn=[0])然后,我使用以下XX = x.T转置列,然后,我使用set()函数。

然而,我没有得到[-10 24 30],而是得到了以下[0 1 2 3 4]

所以set()读取索引而不是读取第一列

set()接受一个iterable。

使用pandas数据框作为iterable依次生成列名。

由于您已经调换了数据框,您的索引值现在是列名,所以当您使用调换后的数据框作为iterable时,您将获得这些索引值。

如果您想使用set来获取set()列中的值,您可以使用:

x = pd.DataFrame(df1, colmns=[0])
set(x.iloc[:,0].values)

但是如果你只想要第0列的唯一值那么你可以使用

df1[[0]].unique()

最新更新