我正在尝试导入panda中的多个文件。我在文件夹中创建了3个文件文件读取的[文件1.xlsx、文件2.xlsx和文件3.xlsx]=os.listdir(cwd(
import os
import pandas as pd
cwd = os.path.abspath(r'C:UsersabcOneDriveImport Multiple files')
files = os.listdir(cwd)
df = pd.DataFrame()
for file in files:
if file.endswith('.xlsx'):
df = df.append(pd.read_excel(file), ignore_index=True)
df.head()
# df.to_excel('total_sales.xlsx')
print (files)
在运行代码时,我得到了错误(即使文件确实存在于文件夹中(
FileNotFoundError:[Erno 2]没有这样的文件或目录:"File1.xlsx">
理想情况下,我想要一个代码,在其中我在list中定义一个文件列表,然后使用路径和文件list通过循环读取文件。
我认为以下内容应该适用于
import os
import pandas as pd
cwd = os.path.abspath(r'C:UsersabcOneDriveImport Multiple files')
paths = [os.path.join(cwd,path) for path in os.listdir(cwd) if path.endswith('.xlsx')]
df = pd.concat(pd.read_excel(path,ignore_index=True) for path in paths)
df.head()
其想法是获得完整路径的列表,然后读取所有路径,并将它们连接到下一行上的单个数据帧中