我正在使用Nokogiri,并试图从链接包含original
的网页中获取所有链接,使用类似的东西:
doc = Nokogiri::XML(open(some_url))
links = doc.xpath('//a[@href*="original"]')
p links.map {|link| link['href']}
"包含"选择器*=
在此表达式中不起作用,我遇到语法错误。
我还试图找到一个等于a[@href="link_from_page"]
的href
,但它再次一无所获。我做错了什么?
您可以使用CSS Selectors[attributename*="val"]
如下所示:
doc = Nokogiri::XML(open(some_url))
links = doc.css('//a[@href*="original"]')
p links.map {|link| link['href']}
该语法在XPath中无效。为了获得href
属性中包含给定字符串的所有链接,您应该使用:
//a[contains(@href, "original")]
点击此处了解更多信息。