我正在使用以下代码读取Java中的JSON文件:
String data = Files.readFile(jsonFile)
.trim()
.replaceAll("[^\x00-\x7F]", "")
.replaceAll("[\p{Cntrl}&&[^rnt]]", "")
.replaceAll("\p{C}", "");
在我的JSON文件中,有一个唯一的字符:'あ'(12354(,其被解释为:"读取文件时(什么都没有(。
我如何使这个字符显示在我的变量"中;数据";?
根据我得到的答案,我知道数据是通过添加replaceAll("[^\x00-\x7F]", "")
从高位ASCII字符中清除的。但是,如果我想清除除此字符之外的所有高ASCII字符,我该怎么办あ'?
您想要的字符是unicode字符HIRAGANA LETTER A,代码为U+3042。
您可以简单地将其添加到有效字符列表中:
...
.replaceAll("[^\x00-\x7F\u3042]", "")
...