Ruby 中是否有任何 HTML 解析器可以将 HTML 文档读取到 DOM 树中并将 HTML 标签表示为 DOM 元素?
我知道Nokogiri,但它不会将HTML解析为DOM树。
尽管你这么说,但Nokogiri是要走的路:
doc = Nokogiri::HTML('<body><p>Hello, worlds!</body>')
它甚至解析无效的 HTML 并返回一个 DOM 树:
>> doc.class
=> Nokogiri::HTML::Document
>> doc.root.class
=> Nokogiri::XML::Element
>> doc.root.children.class
=> Nokogiri::XML::NodeSet
>> doc.root.children.first.content
=> "Hello, worlds!"