将德语单词与umlauts与unicode进行比较



我正在努力将字符串从英语翻译成德语,但是已经翻译的德语单词再次被翻译。

说我有这个词" beim hinzuf u00e4gen",它已经翻译过。我想将其与同一词相提并论,但要与" BeimHinzufügen"相提并论。两个文件都读为ISO-8859-1,但是当我比较单词时,它们被视为与众不同,并且单词再次翻译,我不想要。即使我用Unicode替换Umlaut并比较两者,它们仍然被视为不同。我敢肯定这是因为当我通过" u00e4"重播Umlaut时,会添加额外的后斜线。

任何人都对我要做的事情有了首选方法的想法。

似乎您需要将它们与Collator

进行比较
String left = "Beim Hinzufu00E4gen";
String right = "Beim Hinzufägen";
Collator c = Collator.getInstance();
c.setStrength(Collator.PRIMARY);
int result = c.compare(left, right); // 0

正如@eugene指出的那样,结果正确。您将" hinzuf ü gen"与" hinzuf ä" gen进行了比较。

unicode 00e4是"ä",
Unicode 00fc是"ü"。

最新更新