熊猫不会在我的逗号分隔.txt文件中分隔列



我知道这个问题已经被问了很多次了,但它让我真的很挠头。我有一个.txt文件,如下所示:

"0,1,2,3,4, ....63,0,1,2,3,4.....63">

"0,1,2,3,4, ....63,0,1,2,3,4.....63">

"0,1,2,3,4, ....63,0,1,2,3,4.....63"

以此类推,对于多行。 因此,这是 64+64 = 128 列,用逗号分隔,而每一行都用双引号括起来。

我使用了以下命令:

#Used this initially
df = pd.read_csv('test_data.txt')
#Used this after reading more stackoverflow answers
df = pd.read_csv('test_data.txt', header = None, sep=",", delimiter=',', quotechar='"', index_col = None)

我知道 sep 和分隔符是相同的参数,但我还是尝试了这两个参数,我也不必指定这些,因为熊猫默认选择逗号。 在此之后,我只是使用:

df.head()

它输出:

0
0   0.00,1.00,2.00,3.00,4.00,5.00,6.00,7.00,8.00,9...
1   0.00,1.00,2.00,3.00,4.00,5.00,6.00,7.00,8.00,9...
2   0.00,1.00,2.00,3.00,4.00,5.00,6.00,7.00,8.00,9...
3   0.00,1.00,2.00,3.00,4.00,5.00,6.00,7.00,8.00,9...
4   0.00,1.00,2.00,3.00,4.00,5.00,6.00,7.00,8.00,9...

它只是将其全部读取为一列,请告知我如何阅读所有 128 列。

这将使您获得所需的结果:

df = pd.read_csv('test_data.txt', header=None)
df = pd.DataFrame(df[0].str.split(',').tolist())

因此,这将读取您的文件,其中每一行都用引号括起来,并将其打包到一列中。

然后,按comma拆分该列,并根据结果构造新的数据帧。

相关内容

  • 没有找到相关文章

最新更新