jTidy-漂亮的打印没有头，标题标签

我正在尝试使用jTidy来漂亮地打印我所拥有的HTML片段。到目前为止，我已经做了以下工作。

protected String prettyPrintHTML(String rawHTML) {
    Tidy tidy = new Tidy();
    tidy.setXHTML(true);
    tidy.setIndentContent(true);
    tidy.setPrintBodyOnly(true);
    tidy.setTidyMark(false);
    // Convert HTML to DOM
    Document htmlDOM = tidy.parseDOM(new ByteArrayInputStream(rawHTML.getBytes()), null);
    // Pretty Print
    OutputStream out = new ByteArrayOutputStream();
    tidy.pprint(htmlDOM, out);
    return out.toString();
}

这是有效的，但是输出包括诸如<html>lt；head>lt；标题>并且<身体>标签。

例如，对于输入<ul>lt；李>sub1<李>lt；李>sub2<ul>lt；李>sub21<李>lt/ul>lt/李>lt/ul>这样，

line 1 column 59 - Warning: inserting missing 'title' element
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
  <head>
    <title>
    </title>
  </head>
  <body>
    <ul>
      <li>
        sub1
      </li>
      <li>
        sub2
        <ul>
          <li>
            sub21
          </li>
        </ul>
      </li>
    </ul>
  </body>
</html>

在浏览了API之后，我找到了setPrintBodyOnly方法（我在上面使用过），但仍然没有运气。

我在这里错过了什么？我试着在谷歌上搜索，但到目前为止，所有的链接都会导致死胡同。

下面的链接中发布了一个类似的问题。它的答案显示了一些实现同样目标的替代方法。

JTidy Node.findBody（）--如何使用？

相关内容

最新更新

热门标签：