"EF BF BF" XML (UTF-8) 中允许的字符吗?



"EF BF BF"是XML(UTF-8)中允许的字符吗?

<?xml version="1.0" encoding="UTF-8" ?>
<XML>
    <DOCUMENT>
        <CONTENT>" "</CONTENT>
    </DOCUMENT>
</XML>

如果"EF BF BF"是一个拼写错误,而你的意思是"EF BBBF":

是的,如果是第一个字节。它们是"BOM",字节顺序标记,用于标识文件的字节顺序。

对于 UTF-16 和 UTF-32 编码的文件,这是强制性的。

对于 UTF-8,这是可选的。如果存在它,某些系统可能会对此感到困惑,如果在期望例如 ISO-8859-1 的上下文中使用带有 BOM 的 UTF-8 文件,则可能会产生意外行为。

编辑:如果"EF BF BF"不是拼写错误,则文件中任何地方的 UTF-8 都不是有效的。

它是"替换字符"的 UTF-8 表示形式:https://www.fileformat.info/info/unicode/char/fffd/index.htm