我想找到所有 href 属性等于值 'a'、'b' 或 'c' 的锚元素
到目前为止,我所做的是:
values = ['a','b','c']
anchors = page.css('a')
anchors.each do |anchor|
if values.include? anchor.attribute('href').value
p "found it"
end
end
有什么方法可以直接选择这些锚点,而无需稍后遍历每个锚点?
CSS 允许我们请求多个不同的选择器:
require 'nokogiri'
html = <<EOT
<html>
<body>
<a href="a">a link</a>
<a href="x">x link</a>
<a href="b">b link</a>
<a href="y">y link</a>
<a href="c">c link</a>
</body>
</html>
EOT
doc = Nokogiri::HTML(html)
doc.search('*[href="a"], *[href="b"], *[href="c"]').each { |n| p n.to_html }
运行返回:
"<a href="a">a link</a>"
"<a href="b">b link</a>"
"<a href="c">c link</a>"
使用
Nokogiri,您可以随时使用 xpath:
<!doctype html>
<html lang="en">
<head></head>
<body>
This is <a href="http://b.com">a link</a>
This is <a href="http://a.com">another link</a>
</body>
</html>
noko_page.xpath("//a[@href='http://a.com' or @href= 'http://b.com']")
=> [#<Nokogiri::XML::Element:0x3fc9360be368 name="a" attributes=[#<Nokogiri::XML::Attr:0x3fc9360bdcd8 name="href" value="http://b.com">] children=[#<Nokogiri::XML::Text:0x3fc93618e93c "a link">]>, #<Nokogiri::XML::Element:0x3fc93618dc08 name="a" attributes=[#<Nokogiri::XML::Attr:0x3fc93618d71c name="href" value="http://a.com">] children=[#<Nokogiri::XML::Text:0x3fc93618fd78 "another link">]>]