我有以下XML:
<types>
<type>
<name>derived</name>
<superType>base</superType>
<properties>
<property>
<name>B1</name>
</property>
<property>
<name>D1</name>
</property>
</properties>
</type>
<type>
<name>base</name>
<properties>
<property>
<name>B1</name>
</property>
</properties>
</type>
</types>
我想转换成这个输出:
derived
D1
base
B1
请注意,节点/types/type[name='derived']/properties/property[name='B1']
已被跳过,因为它在基本类型中存在为:/types/type[name='base']/properties/property[name='B1']
。
我想出了这个XSLT:
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text" omit-xml-declaration="yes"/>
<xsl:strip-space elements="*"/>
<!-- Do nothing for base class properties -->
<!-- Wouldn't be necessary if the match criteria could be applied in the select -->
<xsl:template match="property"/>
<xsl:template match="property[not(//type[name=current()/../../superType]/properties/property[name=current()/name])]">
<xsl:text>	</xsl:text>
<xsl:value-of select="name"/>
<xsl:text> </xsl:text>
</xsl:template>
<xsl:template match="types/type">
<xsl:value-of select="name"/>
<xsl:text> </xsl:text>
<xsl:apply-templates select="./properties"/>
<xsl:text> </xsl:text>
</xsl:template>
</xsl:stylesheet>
这是可行的(使用Notepad++中的XML Tools插件),但not(//type[name=current()/../../superType]/properties/property[name=current()/name])
XPath表达式的效率非常低:当应用于200K行的XML文件时,转换需要280秒。如果没有这个XPath表达式,转换只需要2秒。
有没有办法加快速度?
测量速度。。。
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text" encoding="utf-8"/>
<xsl:strip-space elements="*"/>
<xsl:key name="kPropertyByName" match="property" use="name" />
<xsl:template match="property">
<xsl:variable name="supertype" select="../../superType/text()" />
<xsl:if test="($supertype = '') or not ( key('kPropertyByName',name)/../../name[.=$supertype])">
<xsl:value-of select="concat('	',name,'
')" />
</xsl:if>
</xsl:template>
<xsl:template match="type">
<xsl:value-of select="concat(name,'
')" />
<xsl:apply-templates select="properties" />
<xsl:text>
</xsl:text>
</xsl:template>
</xsl:stylesheet>
加速它的最简单方法是使用优化的XSLT处理器-Saxon EE应该发现这个表达式可以从哈希索引中受益,将它从O(n^2)变成O(n)。
下一个最好的方法是使用按键手动优化,正如Durkin所建议的那样。