我正在尝试在dask中读取CSV。它读取所有列,但向左移1。因此,应该在第一列以下的数据变为索引,第二列成为第一等,最后一列具有所有NAN。
一个例子 -
a,b,c
1,2,3
4,5,6
7,8,9
在DataFrame中看起来像这样 -
a,b,c
1 2,3,Nan
4 5,6,Nan
7 8,9,Nan
pandas具有index_col=False
功能,使我可以避免这种情况。dask中是否有一些可以让我这样做的。
我希望您的数据与您显示的数据不同,因为它可以正常工作:
In []: with open('temp.csv', 'w') as f:
f.write("""a,b,c
1,2,3
4,5,6
7,8,9""")
In []: dd.read_csv('temp.csv').compute()
Out[]:
a b c
0 1 2 3
1 4 5 6
2 7 8 9
这与pandas.read_csv
给出的输出完全相同。
您可以使用skiprows=
,而names=
是文件的标题。