我希望修复一些在段落标记中具有块级元素的XML。XML类似于:
<p>
This is some text with <tag>some other markup</tag> in it that also needs transformation
<div>
Oh no here is a block element
</div>
It is even worse as <i>there is more content</i> between that needs transform
<div>
more block content
</div>
more text
</p>
所以模式是任意文本和节点混合在块级元素。它可以是任意数量的div和其他文本,所以使用索引的答案并不适用于所有情况。
我想把它转换成
<p>This is some text with <transformed-tag>some other markup</transformed-tag> in it that also needs transformation</p>
<div>Oh no here is a block element</div>
<p>It is even worse as <i>there is more content</i> between that needs transform</p>
<div>more block content</div>
<p>more text</p>
所以从本质上讲,我想捕获p
的所有后代,它们不在div
标签中,并用p
标签包装它们,同时保留文本和div的顺序。我已经尝试了一切,但不确定如何捕捉div之间的文本。我已经能够将数据从第一个blob转换到第一个div,然后使用
<xsl:template match="p[following::div]">
<p><xsl:apply-templates/></p>
</xsl:template>
<xsl:template match="p[preceding::div]">
<p><xsl:apply-templates/></p>
</xsl:template>
更新:使输出匹配。在div和p标签中输出的文本也需要有模板应用,因为可能有嵌套在那里的元素需要应用样式。
好的,我在这里错过了什么?
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>
<xsl:template match="/p">
<root>
<xsl:apply-templates select="node()[1]" mode="first"/>
<xsl:apply-templates select="div[1]"/>
</root>
</xsl:template>
<xsl:template match="node()" mode="first">
<p>
<xsl:copy/>
<xsl:apply-templates select="following-sibling::node()[1][not(self::div)]" mode="next"/>
</p>
</xsl:template>
<xsl:template match="node()" mode="next">
<xsl:copy>
<xsl:apply-templates/>
</xsl:copy>
<xsl:apply-templates select="following-sibling::node()[1][not(self::div)]" mode="next"/>
</xsl:template>
<xsl:template match="tag" mode="next">
<transformed-tag>
<xsl:apply-templates/>
</transformed-tag>
<xsl:apply-templates select="following-sibling::node()[1][not(self::div)]" />
</xsl:template>
<xsl:template match="div">
<xsl:copy-of select="."/>
<xsl:apply-templates select="following-sibling::node()[1][not(self::div)]" mode="first"/>
<xsl:apply-templates select="following::div[1]"/>
</xsl:template>
</xsl:stylesheet>