dask中索引的问题以及Q左右的数据转移



我正在尝试在dask中读取CSV。它读取所有列,但向左移1。因此,应该在第一列以下的数据变为索引,第二列成为第一等,最后一列具有所有NAN。

一个例子 -

a,b,c
1,2,3
4,5,6
7,8,9

在DataFrame中看起来像这样 -

  a,b,c
1 2,3,Nan
4 5,6,Nan
7 8,9,Nan

pandas具有index_col=False功能,使我可以避免这种情况。dask中是否有一些可以让我这样做的。

我希望您的数据与您显示的数据不同,因为它可以正常工作:

In []: with open('temp.csv', 'w') as f:
    f.write("""a,b,c
    1,2,3
    4,5,6
    7,8,9""")
In []: dd.read_csv('temp.csv').compute()
Out[]: 
   a  b  c
0  1  2  3
1  4  5  6
2  7  8  9

这与pandas.read_csv给出的输出完全相同。

您可以使用skiprows=,而names=是文件的标题。

最新更新