我有一个这样的内容:
[caption id="attachment_3182" align="aligncenter" width="800" caption="blah blah"]<img class="size-full wp-image-3182" title="blah" src="http://www.test.com/blah.jpg" alt="" width="800" height="533" />[/caption]
<div>other code here</div>
我想从中得到所有的caption
元素,所以我试着这样做:
doc.css("[caption]")
和doc.xpath('.//[caption]')
试试doc.css("[caption]").attr("caption")
我将[caption]
转换为<caption>
标签。在我的例子中是:
text.gsub!("[caption", "<caption").gsub!('"]', '">').gsub!("[/caption]", "</caption>")
之后,我能够获得<caption.
标签与Nokogiri。