我有一个.tsv文件,它看起来像MSExcel 中的.tsv file结构
我想通过pytorch来确定它的形状。我该怎么做
我写了一个代码
导入panda作为pd
df=pd.read_csv(路径/到/.tsv(
df.shape
并输出
(13596,1(
但很明显,形状与我提供的图像相冲突。我做错了什么?
使用pd.read_csv时需要指定数据的分隔方式(除非是逗号分隔(
df = pd.read_csv(path/to/.tsv, sep = 't')
应正确加载数据。
请参阅:https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html
编辑:在查看数据时,您还应该指定header=None
,因为您没有标题行。理想情况下,还可以使用pd.read_csv
的names
参数提供列名列表
问题是您缺少分隔符属性
import pandas as pd
df = pd.read_csv("data/test.txt")
print(df.shape)
输出:(2,1(
import pandas as pd
df = pd.read_csv("data/test.txt", sep='t')
print(df.shape)
输出:(2,3(
因此,请将sep='t'
添加到您的read_csv 中
此外,如果你有一个标题,你可以通过标题=0
pd.read_csv("data/test.txt", sep='t', header=0)
Plz让我知道它是否有助于