请问我们是否可以使用set()
读取pandas中特定列的数据?例如,我从DataFrame df1得到以下输出:
df1= [
0 -10 2 5
1 24 5 10
2 30 3 6
3 30 2 1
4 30 4 5
]
,其中第一列是索引。我首先尝试隔离第二列
[-10
24
30
30
30]
使用如下:x = pd.DataFrame(df1, coulmn=[0])
然后,我使用以下XX = x.T
转置列,然后,我使用set()
函数。
然而,我没有得到[-10 24 30]
,而是得到了以下[0 1 2 3 4]
所以set()
读取索引而不是读取第一列
set()
接受一个iterable。
使用pandas数据框作为iterable依次生成列名。
由于您已经调换了数据框,您的索引值现在是列名,所以当您使用调换后的数据框作为iterable时,您将获得这些索引值。
如果您想使用set来获取set()
列中的值,您可以使用:
x = pd.DataFrame(df1, colmns=[0])
set(x.iloc[:,0].values)
但是如果你只想要第0列的唯一值那么你可以使用
df1[[0]].unique()