HtmlAgilityPack获取渲染HTML



我正在使用HTMLAgilityPack,我希望文档能以网站上显示的方式出现。意思是,如果一个html元素具有可见性:display:none,我不希望在我的文档中出现该节点。

是否有任何方法可以排除具有可见或隐藏的节点??

例如

<div class="changeodlabel" style="display:none;"><span class="default">Should not be in document html</span></div>
<div class="changeodlabel" ><span class="default">Should be in document html</span></div>

Html敏捷包不知道CSS和Javascript的含义,因此它只是解析Html,让你决定如何处理它。如果你想在获取内容之前对页面进行全面评估,你需要一个更高级的Html解析器。脑海中浮现出敬畏之心。或者你可以包装PhantomJS(查看ChutzPah的来源,看看如何做到这一点)。

最新更新