我正在使用JSoup来清理和验证传入的HTML代码,以防止XSS攻击。 它从isValid()返回false,我不得不使用Eclipse调试器浏览JSoup源代码以查找问题。 最终我发现它拒绝了"a"元素,因为它不喜欢"rel"属性。 有没有办法让JSoup向我(而不是页面的用户)报告为什么HTML无效?
是的。调用 Parser.setTrackErrors
以启用错误报告,分析 HTML,然后调用 getErrors
以检索ParseError
对象的列表。
来源:Parser
的 API 文档