有一些克罗地亚字符串带有 mysql db 中的一些字符。
我调用一个使用 Node 编写的 API.js它反过来调用基于 Java 的 API,进而从 mysql db 获取数据。
我想找出 API 层中的编码使这些(左)变成不同的东西(右)。
- Mreže -> Mre~e
- 扎什蒂塔 -> 扎阿蒂塔
- poslužiteljskim -> poslu~iteljskim
- Omogućavaju -> Omogucavaju
我试过谷歌搜索,但没有帮助。
任何帮助,不胜感激。提前感谢!
前三个是由某人获得 UTF-16 并认为"哦,我会删除每隔一个字节,以便我可以将其处理为 ASCII"创建的。
>>> hex(ord(u'ž'))
'0x17e'
>>> hex(ord(u'~'))
'0x7e'
>>> hex(ord(u'š'))
'0x161'
>>> hex(ord(u'a'))
'0x61'
第四个我没有解释,除了一些 unidecode 操作。
>>> hex(ord(u'ć'))
'0x107'