DTD 元素类型接受"<"



我有一个xml文件,可能看起来像这样:

<unclassified>
  WOOD FIRM FINED #30,000 OVER TEEN'S LOST ARM<
</unclassified>

.dtd声明:

<!ELEMENT unclassified   (#PCDATA)>

不幸的是,这似乎不起作用,因为我总是收到这样的错误:

[Fatal Error] arm1sub.sgml:14:46: The content of elements must consist of well-formed character data or markup.
org.xml.sax.SAXParseException; systemId: file:/home/sfalk/workspace/project/target/classes/meter_corpus/PA/annotated/courts/12.07.99/arm/arm1sub.sgml; lineNumber: 14; columnNumber: 46; The content of elements must consist of well-formed character data or markup.
    at com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(DOMParser.java:257)
    at com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(DocumentBuilderImpl.java:348)
    at javax.xml.parsers.DocumentBuilder.parse(DocumentBuilder.java:205)

我怎样才能做到这一点?我希望这在不操作.xml文件的情况下是可行的。。

在DTD中没有什么可以更改的东西来解决这个问题必须更改"XML"文档本身。(从技术上讲,您的文档甚至不是真正的XML。)

DTD(和XSD)的权限是验证,但XML有效的先决条件是其格式良好。(事实上,文档是XML的一个先决条件是它是格式良好的。)

请阅读格式良好的XML与有效的XML以获得对差异的全面解释。对于您的特定问题,<替换为&lt;,以使您的XML格式良好

如果您想为xml解析器使用包含无效字符的值,可以使用CDATA:http://www.w3schools.com/xml/xml_cdata.asp

<unclassified>
  <![CDATA[WOOD FIRM FINED #30,000 OVER TEEN'S LOST ARM<]]>
</unclassified>

或者,如果你把一个低于你不想…

<unclassified>
  WOOD FIRM FINED #30,000 OVER TEEN'S LOST ARM
</unclassified>

相关内容

最新更新