如何从字符串中提取数字?如果xpath是"td[5]p/@title"
HTML:
<td valign="top" align="center">
<p title="6 en su sucursal" style="margin-top: 0px; margin-bottom:0px; cursor:hand">
<b>10</b>
</p>
</td>
我需要从标题属性字符串值"6 en-su sucually"中提取数字6
在html
中提供一些HTML,您可以这样做:
doc = Nokogiri::HTML(html)
numbers = doc.xpath('//p[@title]').collect { |p| p[:title].gsub(/[^d]/, '') }
然后,您将获得numbers
数组中的数字。当然,您必须调整XPath和正则表达式以匹配实际数据,但基本技术应该很清楚。
花点时间学习Nokogiri文档和教程可能会很有成效。