读取唯一字符:从 Java 中的 JSON 文件'あ'



我正在使用以下代码读取Java中的JSON文件:

String data = Files.readFile(jsonFile)
.trim()
.replaceAll("[^\x00-\x7F]", "")
.replaceAll("[\p{Cntrl}&&[^rnt]]", "")
.replaceAll("\p{C}", "");

在我的JSON文件中,有一个唯一的字符:'あ'(12354(,其被解释为:"读取文件时(什么都没有(。

我如何使这个字符显示在我的变量"中;数据";?


根据我得到的答案,我知道数据是通过添加replaceAll("[^\x00-\x7F]", "")从高位ASCII字符中清除的。但是,如果我想清除除此字符之外的所有高ASCII字符,我该怎么办あ'?

您想要的字符是unicode字符HIRAGANA LETTER A,代码为U+3042。

您可以简单地将其添加到有效字符列表中:

...
.replaceAll("[^\x00-\x7F\u3042]", "")
...

最新更新