如何使用Nokogiri仅选择不仅是空间的节点



我有以下XML文档:

<w:p w14:paraId="572705D7" w14:textId="77777777" w:rsidP="00CA0169" w:rsidR="00CA0169" w:rsidRDefault="00CA0169" w:rsidRPr="00777A35">
    <w:r>
        <w:t xml:space="preserve"/>
    </w:r>
    <w:r>
        <w:t>synthesized in cyanobacteria under unsuitable condition</w:t>
    </w:r>
</w:p>

我目前选择以下开头的所有节点:

text_nodes = p.xpath('w:r')

但是,我只想选择那些包含文本的文本节点,而不仅仅是空格,因为第一个节点如上面的 xml 示例所示。

我已经扩展了字符串类来测试空格,如下所示:

class String
  def spaces?
    x = self =~ /^s+$/
    x == 0
  end
end

所以我可以做:

element.text.spaces?

我只是不知道如何将其与仅选择不仅是空格的节点的p.xpath('w:r')放在一起。

w:r[normalize-space(.) != '']

就像你的 XPath 表达式应该做的那样。

相关内容

  • 没有找到相关文章

最新更新