我有一个这样的HTML结构:
<div class='content'>
<h2>Title</h2>
<p>Some content for Title</p>
<h2>Another Title</h2>
<p>Content for Another Title</p>
<p>Some more content for Another title</p>
<h2>Third</h2>
<p>Third Content</p>
</div>
我想写代码输出:
Title
- Some content for Title
Another Title
- Content for Another Title
- Some more content for Another title
Third
- Third Content
直到五分钟前我才开始使用Nokogiri,目前我能想到的只有:
content = doc.at_css('.content')
content.css('h2').each do |node|
puts node.text
end
content.css('p').each do |node|
puts " - "
puts node.text
end
这显然没有把这些片段组合在一起。我怎样才能与Nokogiri达到我所要求的分组?
你差一点就成功了。以下是我将如何修复它。
content.css('h2').each do |node|
puts node.text
while node = node.at('+ p')
puts " - #{node.text}"
end
end
+ p
表示下一个(相邻的)p
有很多方法可以做到这一点,这里有一个:
doc.at_css('.content').element_children.each do |node|
puts(node.name == "h2" ? node.text : " - #{node.text}")
end