错误:当我试图读取excel文件- pandas时,文件不是一个可识别的excel文件



我一直在尝试阅读一个excel文件与read_excel熊猫方法df_archivo = pd.read_excel(relative_file_path),但它抛出我一个错误。

ValueError: File is not recognized excel File

def procesar_archivos_bitacora(directorio):
# Obtener la lista de archivos en el directorio
lista_archivos = get_files_in_path(directorio)
folder='input/'
download_all_files(lista_archivos,folder)
for archivo in lista_archivos:
local_path = join(folder,archivo)
print('joined path: ',local_path)
formatear_bitacora(local_path)

如你所见,我的reading方法在一个循环中。"连接路径"和我期待的一样。在输入文件夹里面只有excel文件。

我遵循的步骤是:

  1. 我从sharepoint目录下载文件
  2. 我将每个下载的文件名加入下载文件夹目录
  3. 然后我尝试使用循环读取每个文件

xlrd只支持.xls文件。有两种变通方法:

首先(我推荐的)是安装openpyxl

pip install openpyxl

然后把openpyxl进入pd.read_excel的发动机参数

pd.read_excel(local_path, engine='openpyxl')

第二是降级xlrd

版本
pip install xlrd==1.2.0

最新更新