导入熊猫中的多个文件



我正在尝试导入panda中的多个文件。我在文件夹中创建了3个文件文件读取的[文件1.xlsx、文件2.xlsx和文件3.xlsx]=os.listdir(cwd(

import os
import pandas as pd
cwd = os.path.abspath(r'C:UsersabcOneDriveImport Multiple files') 
files = os.listdir(cwd)  
df = pd.DataFrame()
for file in files:
if file.endswith('.xlsx'):
df = df.append(pd.read_excel(file), ignore_index=True) 
df.head() 
# df.to_excel('total_sales.xlsx')
print (files)

在运行代码时,我得到了错误(即使文件确实存在于文件夹中(

FileNotFoundError:[Erno 2]没有这样的文件或目录:"File1.xlsx">

理想情况下,我想要一个代码,在其中我在list中定义一个文件列表,然后使用路径和文件list通过循环读取文件。

我认为以下内容应该适用于

import os
import pandas as pd
cwd = os.path.abspath(r'C:UsersabcOneDriveImport Multiple files') 
paths = [os.path.join(cwd,path) for path in os.listdir(cwd) if path.endswith('.xlsx')]
df = pd.concat(pd.read_excel(path,ignore_index=True) for path in paths)
df.head()

其想法是获得完整路径的列表,然后读取所有路径,并将它们连接到下一行上的单个数据帧中

最新更新