转义 XML 中的特殊字符/符号



在我的数据库中使用表创建XML时,我得到了许多特殊字符,如注册商标,商标,学位,不同的标点符号等(这些以符号形式,十六进制,名称代码,数字代码的形式存在)... 其他一些词,如 、°、...

在我的XML中,一些字符也显示为x99,xEA等。

在使用 JAVA 代码创建 XML 时,是否有一个库/API 来处理所有这些。我正在为我的 XML 使用"UTF-8"字符编码。

此外,我无法清理我的数据库以获得一致的数据,因为它是生产数据。

一个可能的选择是将数据括在 CDATA 标记中,这会将数据标记为可能包含标记的字符数据,但不应按标记进行处理。

有一个免费的命令行工具,用于将文本中带有特殊字符的文件转换为有效的XML。它还确保文件编码与声明中指定的内容匹配。

还有一个Java开发人员套件,允许您使用解析器来解析此类文件(称为XPL),作为XML的替代方法或预处理为XML。它使用一个名为StAX-PL的类似StAX的过程。

最新更新