小贝子编程

查找<a> <href> 包含一些文本的所有链接？

我正在使用Nokogiri，并试图从链接包含original的网页中获取所有链接，使用类似的东西：

doc = Nokogiri::XML(open(some_url))
links = doc.xpath('//a[@href*="original"]') 
p links.map {|link| link['href']}

"包含"选择器*=在此表达式中不起作用，我遇到语法错误。

我还试图找到一个等于a[@href="link_from_page"]的href，但它再次一无所获。我做错了什么？

您可以使用CSS Selectors[attributename*="val"]如下所示：

doc = Nokogiri::XML(open(some_url))
links = doc.css('//a[@href*="original"]') 
p links.map {|link| link['href']}

该语法在XPath中无效。为了获得href属性中包含给定字符串的所有链接，您应该使用：

//a[contains(@href, "original")]

点击此处了解更多信息。

相关内容