我有一个xml文件,可能看起来像这样:
<unclassified>
WOOD FIRM FINED #30,000 OVER TEEN'S LOST ARM<
</unclassified>
.dtd声明:
<!ELEMENT unclassified (#PCDATA)>
不幸的是,这似乎不起作用,因为我总是收到这样的错误:
[Fatal Error] arm1sub.sgml:14:46: The content of elements must consist of well-formed character data or markup.
org.xml.sax.SAXParseException; systemId: file:/home/sfalk/workspace/project/target/classes/meter_corpus/PA/annotated/courts/12.07.99/arm/arm1sub.sgml; lineNumber: 14; columnNumber: 46; The content of elements must consist of well-formed character data or markup.
at com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(DOMParser.java:257)
at com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(DocumentBuilderImpl.java:348)
at javax.xml.parsers.DocumentBuilder.parse(DocumentBuilder.java:205)
我怎样才能做到这一点?我希望这在不操作.xml文件的情况下是可行的。。
在DTD中没有什么可以更改的东西来解决这个问题必须更改"XML"文档本身。(从技术上讲,您的文档甚至不是真正的XML。)
DTD(和XSD)的权限是验证,但XML有效的先决条件是其格式良好。(事实上,文档是XML的一个先决条件是它是格式良好的。)
请阅读格式良好的XML与有效的XML以获得对差异的全面解释。对于您的特定问题,将<
替换为<
,以使您的XML格式良好
如果您想为xml解析器使用包含无效字符的值,可以使用CDATA:http://www.w3schools.com/xml/xml_cdata.asp
<unclassified>
<![CDATA[WOOD FIRM FINED #30,000 OVER TEEN'S LOST ARM<]]>
</unclassified>
或者,如果你把一个低于你不想…
<unclassified>
WOOD FIRM FINED #30,000 OVER TEEN'S LOST ARM
</unclassified>