当我从SQL获取数据时,我得到了值中带有问号符号的黑钻石。我知道这是因为编码。我想做的是用空格替换那些未知的字符。我发现了一些字符的unicode:
["u0060", "u2018", "u2019", "u201C", "u201D", "uFFFD", "u00A0", "u1680", "u180e", "u2000", "u2009", "u200a", "u200b", "u202f", "u205f", "u3000", "u2003"]
但仍有一些表现。有没有这些字符、unicode或函数的列表可以做到这一点?
我认为只有当ascii表中的字符数超过127时,才会出现编码问题。因此,您可以将ascii码大于127的任何字符转换为空格。这可以修复一些误报,但也许对你来说没问题。