如何使用Nokogiri只解析元素中字符串值的一部分?RUBY,机械化



如何从字符串中提取数字?如果xpath是"td[5]p/@title"

HTML:

<td valign="top" align="center">
  <p title="6 en su sucursal" style="margin-top: 0px; margin-bottom:0px; cursor:hand">   
   <b>10</b>
  </p>
</td>

我需要从标题属性字符串值"6 en-su sucually"中提取数字6

html中提供一些HTML,您可以这样做:

doc     = Nokogiri::HTML(html)
numbers = doc.xpath('//p[@title]').collect { |p| p[:title].gsub(/[^d]/, '') }

然后,您将获得numbers数组中的数字。当然,您必须调整XPath和正则表达式以匹配实际数据,但基本技术应该很清楚。

花点时间学习Nokogiri文档和教程可能会很有成效。

相关内容

  • 没有找到相关文章

最新更新