我想使用Nokogiri从一些HTML中的所有标签中提取href。
如果我有HTML:<div>
<a href="/test"></a>
</div>
<link href="/test2"></link>
<map href="/test3"></map>
应该怎么做?
您可以使用这个XPath: //@href
来获取href
的所有属性。
的例子:
html = Nokogiri::HTML(html_source)
links = html.xpath('//@href').map(&:value)
# => ["/test", "/test2", "/test3"]