我们的应用程序处理TBX格式的文件,这是一个XML文件。 我们注意到第三方应用程序在子元素(即<term>[BOM]Value text</term>
)的值中添加了 UTF-8 BOM 字符 (EF BB BF
)。
我以为 BOM 字符仅用于文件的开头,指示整个文件的编码。
在 XML 文件中放置 [BOM] 字符是否正确,或者我们可以认为该文件已损坏?
如果根据 XML 规范放置正确,我们是否应将 [BOM] 字符视为:
a) 元素的部分文本价值
或
b) 对相关元素(并且仅适用于该元素及其子元素)的编码的临时指示
您可以在各种在线服务(如 www.validator.w3.org、www.xmlvalidation.com 等)上检查生成的 XML 文件的有效性