Ruby on rails - Nokogiri 解析 HTML,但只找到第一次出现



我有这个 HTML:

<div class="pl-item-content clear" style="width: 176px; height: 385.875px;">
  <div class="pricing-info-container">
    <table cellspacing="0" class="product-prices">
      <colgroup>
        <col class="col-name"><col class="col-price">
      </colgroup>
      <tbody>
      <tr>
        <th class="col-name" scope="row">Prezzo a catalogo</th>
        <td class="col-price">96,09 €</td>
      </tr>
      <tr>
        <th class="col-name" scope="row">Prezzo</th>
        <td class="col-price">63,00 €</td>
      </tr>
      <tr>
        <th class="col-name" scope="row">Risparmio</th>
        <td class="col-price col-saving">34,4%</td>
      </tr>
      <tr>
        <th class="col-name" scope="row">Disponibilità</th>
        <td class="col-price"><div class="stock-value"><span>16</span></div></td>
      </tr>
      </tbody>
    </table>
  </div>
</div>

我有很多pl-item-content块,所以我需要迭代。

我需要找到价格和%值:96,0963,0034,4

我正在使用Nokogiri来解析HTML文档并提取一些信息。我已经尝试过这个:

doc.css('div.pl-item-content').each do |item|
  puts item.at_css(".pricing-info-container .product-prices td.col-price").text.strip
end

输出是这样的:

96,09 €

63,03 €值不存在。我只找到第一次出现,而不是所有出现。在此之后,我需要找到%值,但这是第二步。

你可以帮我吗?


解决方案是使用 css 而不是 at_css .

如果将其更改为

doc.css('div.pl-item-content').each do |item|
  puts item.css(".pricing-info-container .product-prices td.col-price").text.strip
end

在nokogiri文档中,它说:

- (Object) at_css(*rules)
Search this node for the first occurrence of CSS rules. Equivalent to css(rules).first See Node#css for more information.

nokogiri 的at_css只返回与您的查询匹配的第一个元素。尝试这样的事情:

doc.search('div.pl-item-content').each do |table|
  table.search('table > tr').each do |row|
    puts row.at_css("td.col-price").text.strip
  end
end

也许仍然需要一些调整...去吧。如果您不关心哪个表实际传递了数据,请尝试以下操作:

table.search('table > tr').each do |row|
  puts row.at_css("td.col-price").text.strip
end

干杯

相关内容

  • 没有找到相关文章

最新更新