假设我正在从div.body h3 a
中提取地址。问题是,如果我只想要地址的一部分呢?例如,如果html为:<a href="/usa/sale/100-happy-street">100 Happy Street #PH </a>
我怎么说,我只想显示PH
?
anchor = doc.at('div.body h3 a') # the <a …>…</a> element
link = anchor.text # "100 Happy Street #PH "
last = link[ /#([^#]+)/, 1 ] # "PH"
这个正则表达式(与Ruby on Rails或Nokogiri无关)从字符串中最后一个#
之后的字符串中提取所有文本,假设至少有一个#
。使用last = link.split("#").last
也可以得到类似的结果。