手动解析内部 XML 实体



我正在使用QXmlSimpleReader来解析包含内部定义实体的XML文件,例如

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE root [
<!ELEMENT root (#PCDATA)>
<!ENTITY ent "some internally defined entity">
]>
<root>
text &ent; text
</root>

我正在使用QXmlDefaultHandler子类处理文档,对于内部实体,我能做的最多就是报告它们的使用情况。

默认情况下,所有内部定义的实体(&ent;在上面的示例中)都会自动替换为字符。如何更改此行为,以便可以指定应将它们替换为哪个字符串?如果需要使其工作,我也可以切换到另一个Qt的XML阅读器。

我找到了一种方法来做到这一点,尽管它更像是一种黑客而不是适当的解决方案,因为它不会阻止Qt实际用已解决的字符替换实体字符。这只是忽略这些字符的解决方法。

首先,通过设置适当的功能并处理内容和词法信息来QXmlSimpleReader报表实体:

QXmlSimpleReader xmlReader;
xmlReader.setFeature("http://qt-project.org/xml/features/report-start-end-entity", true);
xmlReader.setContentHandler(handler);
xmlReader.setLexicalHandler(handler);

接下来,在上面的handler中,覆盖bool QXmlLexicalHandler::startEntity(const QString &name)bool QXmlLexicalHandler::endEntity(const QString &name),并保持读取器当前是否正在读取实体的状态。如果是,只需忽略来自bool QXmlContentHandler::characters(const QString &ch)的输入,而只是以startEntityendEntity处理分辨率。

最新更新