如何使用<a>Nokogiri获取标签



我正在使用Nokogiri用Ruby编写一个简单的scraper。

def processNokogiri
doc = HTTParty.get("https://www.remotelyawesomejobs.com/jobs")
@parse_page ||= Nokogiri::HTML(doc)
@jobs = @parse_page.css(".job").first.at_css "h2"
puts '*********************'
puts  @jobs
puts '*********************'
flash[:error] = "Noko"
end

当我打印@jobs时,控制台显示:

<h2>
<a itemprop="title" href="/jobs/the-coral-project-mozilla-infrastructure-integration-engineer">Infrastructure &amp; Integration Engineer</a>
<span class="company">
at
<span itemprop="hiringOrganization">The Coral Project @ Mozilla</span>
</span>
</h2>

我想访问

href="/jobs/the-coral-project-mozilla-infrastructure-integration-engineer" 

公司名称:"珊瑚项目@Mozilla">

如何筛选@jobs实体以访问此数据?

@parse_page.css(".job").first.at_css("h2 .company span").text #=> "The Coral Project @ Mozilla"
@parse_page.css(".job").first.at_css("h2 a")['href'] #=> "/jobs/the-coral-project-mozilla-infrastructure-integration-engineer"

最新更新