从另一个 Excel 文件中提取 Excel 文件路径



我有一个名为"workbooks_to_process.xlsx"的文件,其中的列包含以下 excel 文件的路径:

**files_paths_2_process**     (column header)
c:/work/file01.xlsx
c:/work/file02.xlsx
c:/work/file03.xlsx
………………….
c:/work/file0m.xlsx

另一方面在蟒蛇熊猫

df_0 = pd.read_excel('workbooks_to_process.xlsx') # No issue
list_of_paths = df_0[files_paths_2_process].tolist() # No issue

以下是我想做的(在迭代过程中(

itr = list_of_paths[3]  # or [0], [1], [n] etc
df_1 = pd.read_excel(itr)

有什么方法可以完成上述工作吗?

谢谢!

用于循环访问文件夹中的所有文件以及这些文件中的所有工作表。 试试这个:

import pandas as pd
import os
file_list = [os.path.join(r,file) for r,d,f in os.walk("C:\Users\ref_folder\") for file in f] 
for file in list(file_list):
f = pd.ExcelFile(file)
sheet_names = f.sheet_names
for i in list(sheet_names):
dataframe = pd.read_excel(f,i)

此数据帧将为您提供每个工作表的数据框,也适用于具有 1 张工作表的工作簿。

您可以将文件名与 excel 列文件名匹配,如果匹配,请阅读 df。我觉得这是您可以循环访问文件夹中的文件并作为 df 读取的最通用的方式。

希望有帮助。

试试这个

for itr in range(len(list_of_paths)): df_1 = pd.read_excel(list_of_paths[itr]) ... ...

最新更新