我正在尝试使用Nokogiri在JamBase上抓取事件信息的href。这是网址: http://www.jambase.com/shows/Shows.aspx?ArtistID=0&VenueID=0&City=Philadelphia&State=pa&Zip=19102&radius=0&StartDate=11/1/2013&EndDate=11/1/2014&Rec=False&pagenum=1&pasi=600
事件信息的 href 位于 td.toolCol 下的最后一个锚点中。我可以通过以下方式获得所有 hrefs:
page = Nokogiri::HTML(open("http://www.jambase.com/shows/Shows.aspx?ArtistID=0&VenueID=0&City=Philadelphia&State=pa&Zip=19102&radius=0&StartDate=11/1/2013&EndDate=11/1/2014&Rec=False&pagenum=1&pasi=700"))
page.css("td.toolCol a").map{|x| x["href"]}.each{|f| puts f}
但是我不知道如何抓住最后一个href。(仅供参考,有时 href 是第 3 个或第 4 个元素。最好在最后直接。
谢谢。
CSS :last-*
伪类之一,例如:last-of-type
:
page.css('td.toolCol a:last-of-type').map { |x| x['href'] }