代码:
import pandas as pd
import os
dirname = 'D:SYunBigDataDataScience-masterDataScience-masterdata'
filename = '05. draw_korea_raw.xlsx'
path = os.path.join(dirname, filename)
f = pd.read_excel(path)
print(f)
错误:
raise XLRDError(FILE_FORMAT_DESCRIPTIONS[file_format]+'; not supported')
xlrd.biffh.XLRDError: Excel xlsx file; not supported
i下载了pandas==1.1.5,xlrd==2.0.1,openpyxl==3.0.5,jupyter==1.0.0,python==3.8并试图收集excel数据来制作图形,但代码无法读取xlsx文件。xls旧的excel版本很好,但无法读取新版本的excel文件。有人知道如何解决这个问题吗?或者我应该只使用xls数据或转换来读取文件。ㅠ.ㅠ
或者要解决此问题,请执行以下操作:
安装openpyxl:这是另一个仍然支持xlsx格式的excel包
将引擎设置为"openpyxl",而不是默认值"xlrd">
# Install openyxl pip install openpyxl # set engine parameter to "openpyxl" pd.read_excel(path, engine = 'openpyxl')
多次尝试用panda和xlrd读取xlsx文件。但我无法得到我想要的解决方案。所以我得出了一个结论。bast方法是使用openpyxl 将xlsx转换为xls"OR">
import openpyxl
import pandas as pd
wb = openpyxl.load_workbook('./06. result.xlsx')
sheet = wb.worksheets[0]
f = pd.DataFrame(sheet.values)
但是这个代码使NaN位于第一列。