什么是xml规范化



可能重复:
Java Node normalize方法做什么?

什么是xml规范化。我在javadoc中发现了以下内容,但我不能理解它?有人能帮忙吗?

public void normalize()

将该节点下子树的全部深度中的所有Text节点(包括属性节点(放入"正常"形式,其中只有结构(例如,元素、注释、处理指令、CDATA节和实体引用(分隔Text节点,即既没有相邻的Text节点,也没有空的Text节点。这可用于确保文档的DOM视图与保存和重新加载时的视图相同,并且在使用依赖于特定文档树结构的操作(如XPointer[XPointer]查找(时非常有用。如果附加到Node.ownerDocument的DOMConfiguration对象的参数"normalize characters"为true,则此方法也将完全规范Text节点的字符。注意:在文档包含CDATASection的情况下,单独的规范化操作可能是不够的,因为XPointer不会区分Text节点和CDATASection节点。自:DOM级别3

解析器通常会返回"令人惊讶"的文本节点,其中文本被拆分为多个节点,或者不太常见的空文本节点。这是它们被优化以获得最大性能的副作用。当存在可忽略的空白、缓冲区边界或其他对解析器来说方便的地方时,可能会发生这种情况。

normalize()将消除所有这些意外,合并相邻的文本节点并删除空的文本节点。

API文档非常详细地解释了它,不确定要解释什么。基本上,该方法通过组合相邻的文本节点,消除空文本节点,将从this节点开始的DOM子树转换为"标准格式",并可选地规范Unicode复合字符。

最新更新