Nokogiri群平面结构



我有一个这样的HTML结构:

<div class='content'>
 <h2>Title</h2>
 <p>Some content for Title</p>
 <h2>Another Title</h2> 
 <p>Content for Another Title</p>
 <p>Some more content for Another title</p>
 <h2>Third</h2>
 <p>Third Content</p>
</div>

我想写代码输出:

Title
 - Some content for Title
Another Title
 - Content for Another Title
 - Some more content for Another title
Third
 - Third Content

直到五分钟前我才开始使用Nokogiri,目前我能想到的只有:

content = doc.at_css('.content')
content.css('h2').each do |node|
  puts node.text
end
content.css('p').each do |node|
  puts " - "
  puts node.text
end

这显然没有把这些片段组合在一起。我怎样才能与Nokogiri达到我所要求的分组?

你差一点就成功了。以下是我将如何修复它。

content.css('h2').each do |node|
  puts node.text
  while node = node.at('+ p')
    puts " - #{node.text}"
  end
end

+ p表示下一个(相邻的)p

有很多方法可以做到这一点,这里有一个:

doc.at_css('.content').element_children.each do |node|
  puts(node.name == "h2" ? node.text : " - #{node.text}")  
end

相关内容

  • 没有找到相关文章

最新更新