XSL 转换元素名称中包含字符实体的 XML



我的xml看起来像:

<record>
    <name>ABC</name>
    <address>
        &lt;street&gt;sss&lt;/street&gt;
        &lt;city&gt;ccc&lt;/city&gt;
        &lt;state&gt;ttt&lt;/state&gt;
    </address>
</record>

我正在尝试使用 xsl 读取元素"街道":

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
    <xsl:output omit-xml-declaration="yes" indent="yes" />
    <xsl:template match="/">
        <xsl:value-of select="record/address/street" />
    </xsl:template>
</xsl:stylesheet>

但它不提供任何输出。

即使输入 xml 采用有效的 xml 格式,为什么会发生这种情况?那么如何转换包含元素名称字符实体的 xml 文件呢?

补充一下Michael Kay的回答:

如果首先使用以下方法处理 XML:

XSLT 1.0

<xsl:stylesheet version="1.0" 
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>
<xsl:strip-space elements="*"/>
<!-- identity transform -->
<xsl:template match="@*|node()">
    <xsl:copy>
        <xsl:apply-templates select="@*|node()"/>
    </xsl:copy>
</xsl:template>
<xsl:template match="address">
    <xsl:copy>
        <xsl:value-of select="." disable-output-escaping="yes"/>
    </xsl:copy>
</xsl:template>
</xsl:stylesheet>

并将结果保存到文件,然后您将能够使用样式表来处理结果文件并获得预期的结果。

没有street元素。如果它是<street>...</street>写的,那么它将是一个元素,但尖括号已被小心地转义,以表明它应该被视为纯文本。

将包含尖括号的纯文本转换为 XML 节点结构涉及分析;也就是说,您需要对 address 元素的文本内容执行第二次分析。由于您在这里拥有的是 XML 片段而不是完整的 XML 文档,因此这很复杂。

在 XSLT 3.0 中,您可以使用 parse-xml-fragment() 函数来实现这一点。在早期版本中,您可以通过调用自定义扩展函数来实现它,或者(如@sandeepkamboj建议的那样)通过在 XSLT 中编写一个简单的 XML 解析器来实现它(为此,您需要确信您知道需要处理的 XML 构造子集)。

也许最好的方法是找出为什么有人生成了这个荒谬的文档,并让他们修补他们的方式。

    <xsl:template match="//name"/>
<xsl:template match="record/address">
    <xsl:value-of select="substring-before(., '&lt;city&gt;ccc&lt;/city&gt;')" disable-output-escaping="yes"/>
</xsl:template>

检查此代码。

最新更新