是否可以用熊猫的read_csv阅读分类列?



我尝试通过read_csv作为dtype={n: pandas.Categorical}dtype参数,但这不能正常工作(结果是一个对象)。手册不清楚

0.19.0版本中,您可以在read_csv中使用参数dtype='category':

data = 'col1,col2,col3na,b,1na,b,2nc,d,3'
df = pd.read_csv(pd.compat.StringIO(data), dtype='category')
print (df)
  col1 col2 col3
0    a    b    1
1    a    b    2
2    c    d    3
print (df.dtypes)
col1    category
col2    category
col3    category
dtype: object

如果要指定列的类别使用dtype与字典:

df = pd.read_csv(pd.compat.StringIO(data), dtype={'col1':'category'})
print (df)
  col1 col2  col3
0    a    b     1
1    a    b     2
2    c    d     3
print (df.dtypes)
col1    category
col2      object
col3       int64
dtype: object

相关内容

  • 没有找到相关文章

最新更新