我如何避免漂亮的打印HTML在Nokogiri而使用to_html



我使用Nokogiri与Ruby on Rails v2.3.8。

在使用to_html时,是否有一种方法可以避免在Nokogiri中进行漂亮的打印?

我读到to_xml允许使用to_xml(:indent => 0)完成此操作,但这不适用于to_html

现在我使用gsub来去除换行字符。Nokogiri提供了这样的选择吗?

我使用.to_html(save_with: 0) ?

2.1.0 :001 > require 'nokogiri'
 => true
2.1.0 :002 >  doc = Nokogiri::HTML.fragment('<ul><li><span>hello</span> boom!</li></ul>')
 => #<Nokogiri::HTML::DocumentFragment:0x4e4cbd2 name="#document-fragment" children=[#<Nokogiri::XML::Element:0x4e4c97a name="ul" children=[#<Nokogiri::XML::Element:0x4e4c47a name="li" children=[#<Nokogiri::XML::Element:0x4e4c240 name="span" children=[#<Nokogiri::XML::Text:0x4e4c0a6 "hello">]>, #<Nokogiri::XML::Text:0x4e4c86c " boom!">]>]>]>
2.1.0 :003 > doc.to_html
 => "<ul><li>n<span>hello</span> boom!</li></ul>"
2.1.0 :004 > doc.to_html(save_with: 0)
 => "<ul><li><span>hello</span> boom!</li></ul>"

在nokogiri (1.6.5) + libxml2 2.7.6上测试。Dfsg-1ubuntu1 + ruby 2.1.0p0 (2013-12-25 revision 44422) [i686-linux]

您可以使用Nokogiri::HTML.fragment()而不仅仅是Nokogiri::HTML()。当您执行to_html时,它不会添加换行符,DOCTYPE头或以任何方式使其"漂亮"。

相关内容

  • 没有找到相关文章

最新更新