我正在尝试将tsv文件从本地文件夹合并到pandas数据框架中。我试图遍历文件夹,并将它们附加到数据框架。这是我到目前为止所尝试的:
bigdf=[]
for file in os.listdir(r'C:Usersxxxx'):
print(file)
df = pd.read_csv(r'C:Usersxxxxxxxx' + file, sep='t')
bigdf.append(df)
'file'只给我文件名,而不是文件本身的内容。第4行不能完全工作。有人知道如何在文件中循环,使内容得到附加吗?
你的代码似乎是正确的,但你可以尝试这样做:
import pathlib
rootdir = pathlib.Path(r'C:Usersxxxx')
data = []
for file in rootdir.glob('*.tsv'):
print(file)
df = pd.read_csv(file, sep='t')
data.append(df)
bigdf = pd.concat(data) # or pd.concat(data, axis='columns')