通过DOM解析器处理XML中的CDATA

我以前从未处理过XML，所以我不知道如何在XML文件中处理CDATA。我迷失在节点、父节点、子节点、nList等中

有人能从这些代码片段中告诉我我的问题是什么吗？

我的getTagValue()方法适用于除包含CDATA的"Details"之外的所有标记。

.....
NodeList nList = doc.getElementsByTagName("Assignment");
for (int temp = 0; temp < nList.getLength(); temp++) {
    Node nNode = nList.item(temp);
    if (nNode.getNodeType() == Node.ELEMENT_NODE) {
        Element eElement = (Element) nNode;
        results = ("Class : " + getTagValue("ClassName", eElement)) + 
                  ("Period : " + getTagValue("Period", eElement)) +
                  ("Assignment : " + getTagValue("Details", eElement));
        myAssignments.add(results);
    }
}
.....
private String getTagValue(String sTag, Element eElement) {
    NodeList nlList = eElement.getElementsByTagName(sTag).item(0).getChildNodes();
    Node nValue = (Node) nlList.item(0);
    if((CharacterData)nValue instanceof CharacterData)
    {
        return ((CharacterData) nValue).getData();
    }
    return nValue.getNodeValue();
}

我怀疑您的问题出现在getTagValue方法的以下代码行中：

Node nValue = (Node) nlList.item(0);

你总是生第一个孩子！但你可能不止一个。

以下示例有3个子节点：文本节点"detail"、CDATA节点"with CDATA"和文本节点"here"：

<Details>detail <![CDATA[with cdata]]> here</Details>

如果你运行你的代码，你只得到"细节"，你就失去了其余的

以下示例有1个子节点：CDATA节点"detail with CDATA here"：

<Details><![CDATA[detail with cdata here]]></Details>

如果你运行你的代码，你就会得到一切。

但是上面的例子是这样写的：

<Details>
   <![CDATA[detail with cdata here]]>
</Details>

现在有3个子节点，因为空格和换行符都是作为文本节点拾取的。如果你运行你的代码，你得到了第一个带有换行符的空文本节点，你就失去了其余的

您要么必须循环遍历所有子项（无论有多少），并连接每个子项的值以获得完整结果，要么如果区分纯文本和CDATA内的文本对您来说并不重要，那么首先在文档生成器工厂上设置coalescing属性：

DocumentBuilderFactory docFactory = DocumentBuilderFactory.newInstance();
docFactory.setCoalescing(true);
...

合并指定由该代码生成的解析器将CDATA节点转换为Text节点，并将其附加到相邻的（如果有的话）文本节点。默认情况下，此值设置为false。

相关内容

最新更新

热门标签：