我使用nekohtml解析器来解析我的html代码。有时我的错误,而使用锚标记的内容已经写成这样。
<a href="http://abc.com"><a href="http://abc.com">abc</a></a>
通过nekohtml解析后,我希望内容像这样更正。
<a href="http://abc.com"></a><a href="http://abc.com">abc</a>
为了实现这一点,请帮助配置nekohtml解析。
更新:
在我尝试设置为
之后解析器。setFeature("http://cyberneko.org/html/features/balance-tags", true);
这是没有用的。我没有给出我所期望的结果。它返回与我给定的相同的HTML内容
需要设置一个balance-tags
特性,指定NekoHTML解析器是否应该尝试平衡已解析文档中的标签。
config.setFeature( "http://cyberneko.org/html/features/balance-tags", true );
from the docs:
- 平衡标签通过添加缺失的父元素、使用可选的结束标签自动关闭元素和纠正不平衡的内联元素标签修复了许多常见的错误。为了将HTML文档作为XML处理,不应该关闭这个特性。对于只关心特定元素、属性和/或内容的外观,而不关心文档的不良结构的应用程序,提供此特性是为了增强性能。