"EF BF BF"是XML(UTF-8)中允许的字符吗?
<?xml version="1.0" encoding="UTF-8" ?>
<XML>
<DOCUMENT>
<CONTENT>" "</CONTENT>
</DOCUMENT>
</XML>
如果"EF BF BF"是一个拼写错误,而你的意思是"EF BBBF":
是的,如果是第一个字节。它们是"BOM",字节顺序标记,用于标识文件的字节顺序。
对于 UTF-16 和 UTF-32 编码的文件,这是强制性的。
对于 UTF-8,这是可选的。如果存在它,某些系统可能会对此感到困惑,如果在期望例如 ISO-8859-1 的上下文中使用带有 BOM 的 UTF-8 文件,则可能会产生意外行为。
编辑:如果"EF BF BF"不是拼写错误,则文件中任何地方的 UTF-8 都不是有效的。
它是"替换字符"的 UTF-8 表示形式:https://www.fileformat.info/info/unicode/char/fffd/index.htm