将 excel 导入 pandas 或 dask 时,数据帧空间被类似的代码替换为'_x0200_'和其他特殊字符



我正在尝试使用pandas或dask将csv文件导入python。数据帧和我得到错误

UnicodeDecodeError: 'charmap' codec can't decode byte 0x81 in position 6892: character maps to <undefined>", if i import the excel file (xlsx format) instead all spaces are being replaced by '_x0020_'.

下面是我所有的尝试:

import dask.dataframe as dd
import pandas as pd
import os
os.chdir(...)
names_csv = pd.read_csv('file_name.csv' , encoding = 'cp1252')
names_csv_dd = dd.read_csv('file_name.csv' , encoding = 'cp1252')
names_excel = pd.read_excel("file_name.xlsx")
parts = dask.delayed(pd.read_excel("file_name.xlsx"))
df = dd.from_delayed(parts) 

我在使用pd.read_excel()时遇到了同样的问题,并通过将Excel中的编码更改为Unicode (utf-8)来解决它。

我遵循了这些步骤。

相关内容

  • 没有找到相关文章

最新更新