在XSL中基于令牌大小提取节点



我对XSL完全陌生,正在尝试学习一些东西。假设我有这样一个XML:

<?xml version="1.0" encoding="UTF-8"?>
<Result>
    <Node>
        <node-id>1</node-id>
        <node-path>2,3</node-path>
    </Node>
    <Node>
        <node-id>2</node-id>
        <node-path>2,3,4</node-path>
    </Node>
    <Node>
        <node-id>3</node-id>
        <node-path>123,34</node-path>
    </Node>
    <Node>
        <node-id>4</node-id>
        <node-path>2124,14,14</node-path>
    </Node>
    <Node>
        <node-id>5</node-id>
        <node-path>1,0</node-path>
    </Node>
</Result>

我想得到所有在节点路径字段中只有两个值的节点,比如:

<?xml version="1.0" encoding="UTF-8"?>
    <Result>
    <Node>
        <node-id>1</node-id>
        <node-path>2,3</node-path>
    </Node>
    <Node>
        <node-id>3</node-id>
        <node-path>123,34</node-path>
    </Node>
    <Node>
        <node-id>5</node-id>
        <node-path>1,0</node-path>
    </Node>
</Result>

我该如何在XSL中做到这一点?由于我需要复制节点,我发现我必须使用身份转换作为模板。我还看到我们应该使用递归来计算令牌。我想出了这个:

<?xml version="1.0" encoding="iso-8859-1"?>
<xsl:stylesheet version="1.0"
                xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output method="xml" indent="yes" omit-xml-declaration="yes" />
    <xsl:template name="root-nodes">
        <xsl:for-each select="/Result/Node">
            <xsl:variable name="path" select="node-path" />
            <xsl:call-template name="tokenizer" mode="matcher">
                <xsl:with-param name="list" select="$path" />
                <xsl:with-param name="delimiter" select="','" />
            </xsl:call-template>
        </xsl:for-each>
    </xsl:template>
    <xsl:template match="@*|node()">
        <xsl:copy>
            <xsl:apply-templates select="@*|node()"/>
        </xsl:copy>
    </xsl:template>
    <!-- Could not figure out how to write this recursion -->
    <xsl:template name="tokenizer" mode="matcher">
        <xsl:param name="list"/>
        <xsl:param name="delimiter" />
        <xsl:value-of select="substring-before($list,$delimiter)" />
        <xsl:call-template name="tokenizer">
            <xsl:with-param name="list" select="substring-after($list,$delimiter)" />
            <xsl:with-param name="delimiter" select="','" />
        </xsl:call-template>
    </xsl:template>
</xsl:stylesheet>

但我在递归部分遇到了问题。如何对令牌进行计数,并确保只有当计数为2时才能进行身份转换?如何修复递归模板?我现有的"令牌化器"模板有什么问题(它甚至没有给我令牌)?任何额外的资源/链接都是非常好的。

我认为

<xsl:stylesheet version="1.0"
                xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

    <xsl:template match="@*|node()">
        <xsl:copy>
            <xsl:apply-templates select="@*|node()"/>
        </xsl:copy>
    </xsl:template>
    <xsl:template match="Node[string-length(translate(node-path, ',', '')) != (string-length(node-path) - 1)]"/>

</xsl:stylesheet>

足够了。

由于"路径中有两个值的节点"与"路径中只包含一个逗号的节点"相同,因此可以使用类似的技巧

<?xml version="1.0" encoding="iso-8859-1"?>
<xsl:stylesheet version="1.0"
                xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output method="xml" indent="yes" omit-xml-declaration="yes" />
    <xsl:template match="@*|node()">
        <xsl:copy>
            <xsl:apply-templates select="@*|node()"/>
        </xsl:copy>
    </xsl:template>
    <!-- ignore Nodes whose node path does not contain one comma -->
    <xsl:template match="Node[translate(node-path, translate(node-path, ',', ''), '') != ',']" />
</xsl:stylesheet>

双重翻译技巧是一个很有用的技巧,它提供了一种从字符串中删除所有字符的方法,白名单中的字符除外。在这种情况下,我们将从路径中删除所有非逗号字符,然后检查是否只剩下一个逗号。

相关内容

  • 没有找到相关文章

最新更新