HTML CDATA issue



我在Java中工作,我有这个例子:

http://jsfiddle.net/uAQ94/1/

但是当我想要显示最终的HTML时,我看不到CDATA标记包围的特殊字符。例如:

<![CDATA[à]]  not show the à character

我需要理解这一点,因为我必须执行这段代码:

    try {
        DocumentBuilder builder = DocumentBuilderFactory.newInstance().newDocumentBuilder();
        Document doc = builder.parse(new StringBufferInputStream(escapedStr));
        ITextRenderer renderer = new ITextRenderer();
        renderer.setDocument(doc, null);
        renderer.layout();
        OutputStream os = response.getOutputStream();
        renderer.createPDF(os);
        os.close();
    } catch (Exception ex) {
        ex.printStackTrace();
    }

获取PDF页面。

为什么CDATA不显示任何特殊字符?

在HTML中,CDATA节只能出现在外部XML元素中,并且只能出现在相对较新的浏览器中。

第12.1.5节说

CDATA节只能用于外部内容(MathML或SVG)。

CDATA节也有问题,因为没有简单的方法来呈现CDATA节,其值包含字符串"]]>"

由于这两个原因,大多数HTML渲染器会将CDATA节转换为常规实体转义文本节点。


<p>
  <![CDATA[à]]>
  <![CDATA[ò]]>
  <![CDATA[è]]>+
  <![CDATA[ì]]>
</p>

这些CDATA节不在外部XML中。它们位于常规HTML <p>元素中,因此不允许。

避免这些重音元音编码问题的最简单方法是使用HTML数字字符引用:

<p> &#224; &#242; &#232;+ &#236; </p>

应该等于(规范化后)原始的

最新更新