我有以下XML文档:
<w:p w14:paraId="572705D7" w14:textId="77777777" w:rsidP="00CA0169" w:rsidR="00CA0169" w:rsidRDefault="00CA0169" w:rsidRPr="00777A35">
<w:r>
<w:t xml:space="preserve"/>
</w:r>
<w:r>
<w:t>synthesized in cyanobacteria under unsuitable condition</w:t>
</w:r>
</w:p>
我目前选择以下开头的所有节点:
text_nodes = p.xpath('w:r')
但是,我只想选择那些包含文本的文本节点,而不仅仅是空格,因为第一个节点如上面的 xml 示例所示。
我已经扩展了字符串类来测试空格,如下所示:
class String
def spaces?
x = self =~ /^s+$/
x == 0
end
end
所以我可以做:
element.text.spaces?
我只是不知道如何将其与仅选择不仅是空格的节点的p.xpath('w:r')
放在一起。
w:r[normalize-space(.) != '']
就像你的 XPath 表达式应该做的那样。