在写入包含某些特殊字符的字符串时,例如
Töölönlahdenkatu
使用来自熊猫的to_csv,CSV 中的结果看起来像
T%C3%B6%C3%B6l%C3%B6nlahdenkatu
我们如何按原样编写字符串的文本?这是我to_csv命令
df.to_csv(csv_path,index=False,encoding='utf8')
我什至尝试过
df.to_csv(csv_path,index=False,encoding='utf-8')
df.to_csv(csv_path,index=False,encoding='utf-8-sig')
仍然没有成功。还有其他字符替换为随机符号
'-' to –
有解决方法吗?
您要做的是删除德语变音符号和西班牙语波浪号。有一个简单的解决方案。
import unicodedata
data = u'Töölönlahdenkatu Adiós Pequeño'
english = unicodedata.normalize('NFKD', data).encode('ASCII', 'ignore')
print(english)
输出 : b'Toolonlahdenkatu Adios Pequeno'
让我知道它是否有效或是否有任何边缘情况。
像ö
这样的特殊字符不能像英文字母那样存储在 csv 中。"随机符号"告诉像excel这样的程序在打开文件时将这些字母解释为特殊字符,但是当您在vscode中查看csv时,看不到特殊字符(例如(。