如何处理文件夹中的所有文件?

我想对目录中的所有文件运行我的代码。代码在单个文件上运行良好，但我尝试迭代多个文件告诉我

FileNotFoundError： [Errno 2] 没有这样的文件或目录： 'file.xlsx'

directory = r"C:/Users/name/Desktop/folder/2018"
arrivals_aggregated = pd.DataFrame()
print(os.listdir(directory))
for filename in os.listdir(smt_directory):
print('current file is ' + filename)
x = pd.ExcelFile(filename)
symbols = x_symbols(x)
arv = x.parse(sheet_name='Arrivals', skiprows=5, usecols=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23])
arrivals = x_arrivals(arv, x)
arrivals_aggregated.append(arrivals)

我希望它遍历目录中的所有文件，将结果处理并聚合到大数据帧arrivals_aggregated。相反，它停止在 x = pd。ExcelFile(文件名)，说找不到该文件，即使它在那里，甚至在我包含时打印

打印("当前文件是"+文件名)

它在文件夹中的第一个文件上失败，而从未处理过代码。

这是否有效取决于您运行脚本的位置。如果运行脚本的目录中不存在filename，则会出现FileNotFoundError。

相反，我会这样做：

x = pd.ExcelFile(os.path.sep.join([directory, filename]))

这将确保您将真正的文件位置传递给pd.ExcelFile.

相关内容

最新更新

热门标签：