正在读取子文件夹中的Excel文件,以及如何使用子文件夹名称作为新列值



我有一个主文件夹,里面有不同国家的Excel文件文件夹。

我想知道是否有人知道我如何读取所有这些Excel文件并使用子文件夹/国家/地区名称作为列值。

然后我计划将所有这些文件连接起来,因为它们都是相同的结构。

感谢

你可以尝试这样的东西:

import pandas as pd
import pathlib
main_folder = './data'
data = []
for xlsxfile in pathlib.Path(main_folder).glob('**/*.xlsx'):
df = pd.read_excel(xlsxfile)
df['dirpath'] = xlsxfile.parent
data.append(df)
df = pd.concat(data)

相关内容

最新更新