小贝子编程

dask中索引的问题以及Q左右的数据转移

本文关键字：左右数据转移索引问题 dask python pandas dataframe dask
更新时间 : 2023-09-10
英文 : Problem with Index in Dask with data shifting left by q

我正在尝试在dask中读取CSV。它读取所有列，但向左移1。因此，应该在第一列以下的数据变为索引，第二列成为第一等，最后一列具有所有NAN。

一个例子 -

a,b,c
1,2,3
4,5,6
7,8,9

在DataFrame中看起来像这样 -

  a,b,c
1 2,3,Nan
4 5,6,Nan
7 8,9,Nan

pandas具有index_col=False功能，使我可以避免这种情况。dask中是否有一些可以让我这样做的。

我希望您的数据与您显示的数据不同，因为它可以正常工作：

In []: with open('temp.csv', 'w') as f:
    f.write("""a,b,c
    1,2,3
    4,5,6
    7,8,9""")
In []: dd.read_csv('temp.csv').compute()
Out[]: 
   a  b  c
0  1  2  3
1  4  5  6
2  7  8  9

这与pandas.read_csv给出的输出完全相同。

您可以使用skiprows=，而names=是文件的标题。

dask中索引的问题以及Q左右的数据转移

相关内容

最新更新

热门标签：