获取属性为 href = a,b 或 c 的所有定位点与 Nokogiri 一起



我想找到所有 href 属性等于值 'a'、'b' 或 'c' 的锚元素

到目前为止,我所做的是:

values = ['a','b','c']
anchors = page.css('a')
anchors.each do |anchor|
  if values.include? anchor.attribute('href').value
    p "found it"
  end
end

有什么方法可以直接选择这些锚点,而无需稍后遍历每个锚点?

CSS 允许我们请求多个不同的选择器:

require 'nokogiri'
html = <<EOT
<html>
  <body>
    <a href="a">a link</a>
    <a href="x">x link</a>
    <a href="b">b link</a>
    <a href="y">y link</a>
    <a href="c">c link</a>
  </body>  
</html>
EOT
doc = Nokogiri::HTML(html)
doc.search('*[href="a"], *[href="b"], *[href="c"]').each { |n| p n.to_html }

运行返回:

"<a href="a">a link</a>"
"<a href="b">b link</a>"
"<a href="c">c link</a>"
使用

Nokogiri,您可以随时使用 xpath:

<!doctype html>
<html lang="en">
<head></head>
<body>
  This is <a href="http://b.com">a link</a>
  This is <a href="http://a.com">another link</a>
</body>
</html>

noko_page.xpath("//a[@href='http://a.com' or @href= 'http://b.com']")

=> [#<Nokogiri::XML::Element:0x3fc9360be368 name="a" attributes=[#<Nokogiri::XML::Attr:0x3fc9360bdcd8 name="href" value="http://b.com">] children=[#<Nokogiri::XML::Text:0x3fc93618e93c "a link">]>, #<Nokogiri::XML::Element:0x3fc93618dc08 name="a" attributes=[#<Nokogiri::XML::Attr:0x3fc93618d71c name="href" value="http://a.com">] children=[#<Nokogiri::XML::Text:0x3fc93618fd78 "another link">]>]

相关内容

  • 没有找到相关文章

最新更新