导出数据到CSV熊猫-与外国字符的问题

我正在处理客户地址的数据文件。源数据包含外部字符，采用UTF-8编码。

我这样导入数据:

columns = ['userid','email','firstname','lastname','phonenumber','fax','address','unit','city','province','postalcode','listing_geopoint','website','tier']

data = pd.read_csv(file, delimiter=',', usecols=columns, encoding='utf-8')

…执行一些操作(主要是删除数据)

，然后导出数据如下:clinic.to_excel('clinic-'+revision+'.xlsx',index=False)

(我也试过)

clinic.to_csv('clinic-'+revision+'.csv',sep=seperator,index=False, encoding='utf-8')

在这两种情况下，当我打开导出文件时，我得到的是外部字符的原始unicode值，而不是外部字符。

。3031 boulde la Gare Cliniques Sp u00e9es u00e9es 3me u00e9tage

而不是正确的输出

3031 boul de la Gare Cliniques spacimcialissames 3me samage

我错过了什么?

您确定初始数据是用UTF-8编码的吗?

我以前遇到过latin-1编码的欧洲字符，所以我会尝试用(... encoding='latin1')读取和导出csv

相关内容

最新更新

热门标签：