抓取每个父元素的最后一个锚点 href(使用 Ruby Nokogiri)



我正在尝试使用Nokogiri在JamBase上抓取事件信息的href。这是网址: http://www.jambase.com/shows/Shows.aspx?ArtistID=0&VenueID=0&City=Philadelphia&State=pa&Zip=19102&radius=0&StartDate=11/1/2013&EndDate=11/1/2014&Rec=False&pagenum=1&pasi=600

事件信息的 href 位于 td.toolCol 下的最后一个锚点中。我可以通过以下方式获得所有 hrefs:

page = Nokogiri::HTML(open("http://www.jambase.com/shows/Shows.aspx?ArtistID=0&VenueID=0&City=Philadelphia&State=pa&Zip=19102&radius=0&StartDate=11/1/2013&EndDate=11/1/2014&Rec=False&pagenum=1&pasi=700"))
page.css("td.toolCol a").map{|x| x["href"]}.each{|f| puts f}

但是我不知道如何抓住最后一个href。(仅供参考,有时 href 是第 3 个或第 4 个元素。最好在最后直接。

谢谢。

您可以使用

CSS :last-*伪类之一,例如:last-of-type

page.css('td.toolCol a:last-of-type').map { |x| x['href'] }

相关内容

  • 没有找到相关文章

最新更新