为什么我用java将文件的内容读取为字节数组,从而得到以下输出?
File f = new File( "exampleData.xml" );
byte[] data = getBytesFromFile("data.xml");
for (byte zeichen : data) {
char zzeichenCharacter = (char)zeichen;
System.out.println(zzeichenCharacter + " : " + String.valueOf(zeichen));
}
输出:
: -17
ᄏ : -69
: -65
< : 60
? : 63
当我将内容从文件exampleData.xml复制到另一个名为exampleDataCopy.xml的文件中,并使用上面的相同代码时,我得到了不同的输出:
< : 60
? : 63
x : 120
m : 109
l : 108
前三个字节是Byte顺序标记的UTF-8编码。
十六进制表示为EF BB BF
。
您应该将文件读取为UTF-8,而不是逐字节处理。