我知道这个问题已经被问了很多次了,但它让我真的很挠头。我有一个.txt文件,如下所示:
"0,1,2,3,4, ....63,0,1,2,3,4.....63">
"0,1,2,3,4, ....63,0,1,2,3,4.....63">
"0,1,2,3,4, ....63,0,1,2,3,4.....63"
以此类推,对于多行。 因此,这是 64+64 = 128 列,用逗号分隔,而每一行都用双引号括起来。
我使用了以下命令:
#Used this initially
df = pd.read_csv('test_data.txt')
#Used this after reading more stackoverflow answers
df = pd.read_csv('test_data.txt', header = None, sep=",", delimiter=',', quotechar='"', index_col = None)
我知道 sep 和分隔符是相同的参数,但我还是尝试了这两个参数,我也不必指定这些,因为熊猫默认选择逗号。 在此之后,我只是使用:
df.head()
它输出:
0
0 0.00,1.00,2.00,3.00,4.00,5.00,6.00,7.00,8.00,9...
1 0.00,1.00,2.00,3.00,4.00,5.00,6.00,7.00,8.00,9...
2 0.00,1.00,2.00,3.00,4.00,5.00,6.00,7.00,8.00,9...
3 0.00,1.00,2.00,3.00,4.00,5.00,6.00,7.00,8.00,9...
4 0.00,1.00,2.00,3.00,4.00,5.00,6.00,7.00,8.00,9...
它只是将其全部读取为一列,请告知我如何阅读所有 128 列。
这将使您获得所需的结果:
df = pd.read_csv('test_data.txt', header=None)
df = pd.DataFrame(df[0].str.split(',').tolist())
因此,这将读取您的文件,其中每一行都用引号括起来,并将其打包到一列中。
然后,按comma
拆分该列,并根据结果构造新的数据帧。