我在Java中工作,我有这个例子:
http://jsfiddle.net/uAQ94/1/但是当我想要显示最终的HTML时,我看不到CDATA标记包围的特殊字符。例如:
<![CDATA[à]] not show the à character
我需要理解这一点,因为我必须执行这段代码:
try {
DocumentBuilder builder = DocumentBuilderFactory.newInstance().newDocumentBuilder();
Document doc = builder.parse(new StringBufferInputStream(escapedStr));
ITextRenderer renderer = new ITextRenderer();
renderer.setDocument(doc, null);
renderer.layout();
OutputStream os = response.getOutputStream();
renderer.createPDF(os);
os.close();
} catch (Exception ex) {
ex.printStackTrace();
}
获取PDF页面。
为什么CDATA不显示任何特殊字符?
在HTML中,CDATA节只能出现在外部XML元素中,并且只能出现在相对较新的浏览器中。
第12.1.5节说
CDATA节只能用于外部内容(MathML或SVG)。
CDATA节也有问题,因为没有简单的方法来呈现CDATA节,其值包含字符串"]]>"
。
由于这两个原因,大多数HTML渲染器会将CDATA节转换为常规实体转义文本节点。
<p>
<![CDATA[à]]>
<![CDATA[ò]]>
<![CDATA[è]]>+
<![CDATA[ì]]>
</p>
这些CDATA节不在外部XML中。它们位于常规HTML <p>
元素中,因此不允许。
避免这些重音元音编码问题的最简单方法是使用HTML数字字符引用:
<p> à ò è+ ì </p>
应该等于(规范化后)原始的