无法读取 python 中的 xlsx 文件



代码:

import pandas as pd
import os
dirname = 'D:SYunBigDataDataScience-masterDataScience-masterdata'
filename = '05. draw_korea_raw.xlsx'
path = os.path.join(dirname, filename)
f = pd.read_excel(path)
print(f)

错误:

raise XLRDError(FILE_FORMAT_DESCRIPTIONS[file_format]+'; not supported')
xlrd.biffh.XLRDError: Excel xlsx file; not supported

i下载了pandas==1.1.5,xlrd==2.0.1,openpyxl==3.0.5,jupyter==1.0.0,python==3.8并试图收集excel数据来制作图形,但代码无法读取xlsx文件。xls旧的excel版本很好,但无法读取新版本的excel文件。有人知道如何解决这个问题吗?或者我应该只使用xls数据或转换来读取文件。ㅠ.ㅠ

最新版本的xlrd(2.01(仅支持.xls文件。安装旧版本1.2.0可能会打开.xlsx文件。

或者要解决此问题,请执行以下操作:

  1. 安装openpyxl:这是另一个仍然支持xlsx格式的excel包

  2. 将引擎设置为"openpyxl",而不是默认值"xlrd">

    # Install openyxl
    pip install openpyxl
    # set engine parameter to "openpyxl"
    pd.read_excel(path, engine = 'openpyxl')
    

多次尝试用panda和xlrd读取xlsx文件。但我无法得到我想要的解决方案。所以我得出了一个结论。bast方法是使用openpyxl 将xlsx转换为xls"OR">

import openpyxl
import pandas as pd
wb = openpyxl.load_workbook('./06. result.xlsx')
sheet = wb.worksheets[0]
f = pd.DataFrame(sheet.values)

但是这个代码使NaN位于第一列。

最新更新