读取.xls文件与Python熊猫read_excel不工作,说它是一个.xlsb文件



我试图阅读几个。xls文件,保存在NAS文件夹,与Apache气流,使用read_excel python pandas函数。

这是我使用的代码:

df = pd.read_excel('folder/sub_folder_1/sub_folder_2/file_name.xls', sheet_name=April, usecols=[0,1,2,3], dtype=str, engine='xlrd')

这工作了一段时间,但最近我已经得到这个错误的几个文件:

Excel 2007 xlsb文件;不支持

[…]

xlrd.biffh。Excel 2007 xlsb文件错误;不支持

这些文件显然是。xls文件,但我的代码似乎将它们检测为。xlsb文件,这是不支持的。我更喜欢一种方法来指定它们是。xls文件,或者,一种方法来读取xlsb文件。

不确定这是否相关,但这些文件是由外部团队更新的,他们可能在我不知道的情况下修改了这些文件的一些参数,但我认为如果是这种情况,我会得到不同的错误。

尝试:

import openpyxl
xls = pd.ExcelFile('data.xls', engine='openpyxl')
df = pd.read_excel(xls)

XLRD最近删除了一些excel数据类型的读取功能,比如xlxs

最新更新