如何处理文件夹中的所有文件?



我想对目录中的所有文件运行我的代码。代码在单个文件上运行良好,但我尝试迭代多个文件告诉我

FileNotFoundError: [Errno 2] 没有这样的文件或目录: 'file.xlsx'

directory = r"C:/Users/name/Desktop/folder/2018"
arrivals_aggregated = pd.DataFrame()
print(os.listdir(directory))
for filename in os.listdir(smt_directory):
print('current file is ' + filename)
x = pd.ExcelFile(filename)
symbols = x_symbols(x)
arv = x.parse(sheet_name='Arrivals', skiprows=5, usecols=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23])
arrivals = x_arrivals(arv, x)
arrivals_aggregated.append(arrivals)

我希望它遍历目录中的所有文件,将结果处理并聚合到大数据帧arrivals_aggregated。相反,它停止在 x = pd。ExcelFile(文件名),说找不到该文件,即使它在那里,甚至在我包含时打印

打印("当前文件是"+文件名)

它在文件夹中的第一个文件上失败,而从未处理过代码。

这是否有效取决于您运行脚本的位置。如果运行脚本的目录中不存在filename,则会出现FileNotFoundError

相反,我会这样做:

x = pd.ExcelFile(os.path.sep.join([directory, filename]))

这将确保您将真正的文件位置传递给pd.ExcelFile.

最新更新