在不解码属性和文本节点中的字符实体的情况下分析 XML



有没有办法用SaxParser或类似的解析器来做到这一点?
示例:<root>...<t1 value="&quot;&gt;&#x3d;x&#x20;"> &lt;&lt;&amp;</t1>..</root>

MyXmlHandler:

public void startElementx(final String uri, final String localName,
        final String qName, final Attributes attrs) throws SAXException {
    if ("t1".equalsIgnoreCase(localName)) {
        System.out.println(attrs.getValue(1));
    }
}

输出是 [">=x],但我需要这样的原点值:

 [&quot;&gt;&#x3d;x&#x20;]

在"字符"方法中,我有同样的问题。我得到<<而不是

 &lt;&lt;&amp;

请帮忙。

我认为你的问题与 SAXParser 无关。

您可能正在寻找 StringEscapeUtils 类

最新更新