这是xml中的前三个字符



为什么我用java将文件的内容读取为字节数组,从而得到以下输出?

File f = new File( "exampleData.xml" );
byte[] data = getBytesFromFile("data.xml");
for (byte zeichen : data) {
char zzeichenCharacter = (char)zeichen;
System.out.println(zzeichenCharacter + "  : " + String.valueOf(zeichen));
}

输出:

￯  : -17
ᄏ  : -69
﾿  : -65
<  : 60
?  : 63

当我将内容从文件exampleData.xml复制到另一个名为exampleDataCopy.xml的文件中,并使用上面的相同代码时,我得到了不同的输出:

<  : 60
?  : 63
x  : 120
m  : 109
l  : 108

前三个字节是Byte顺序标记的UTF-8编码。

十六进制表示为EF BB BF

您应该将文件读取为UTF-8,而不是逐字节处理。

最新更新