在csv熊猫蟒蛇中添加特殊字符



在写入包含某些特殊字符的字符串时,例如

    Töölönlahdenkatu

使用来自熊猫to_csv,CSV 中的结果看起来像

    T%C3%B6%C3%B6l%C3%B6nlahdenkatu

我们如何按原样编写字符串的文本?这是我to_csv命令

    df.to_csv(csv_path,index=False,encoding='utf8')

我什至尝试过

    df.to_csv(csv_path,index=False,encoding='utf-8')
    df.to_csv(csv_path,index=False,encoding='utf-8-sig')

仍然没有成功。还有其他字符替换为随机符号

    '-' to –

有解决方法吗?

您要做的是删除德语变音符号和西班牙语波浪号。有一个简单的解决方案。

import unicodedata
data = u'Töölönlahdenkatu Adiós Pequeño'
english = unicodedata.normalize('NFKD', data).encode('ASCII', 'ignore')
print(english)

输出 : b'Toolonlahdenkatu Adios Pequeno'

让我知道它是否有效或是否有任何边缘情况。

ö这样的特殊字符不能像英文字母那样存储在 csv 中。"随机符号"告诉像excel这样的程序在打开文件时将这些字母解释为特殊字符,但是当您在vscode中查看csv时,看不到特殊字符(例如(。