使用domtree进行全浏览器模拟



我想在没有接口的情况下以编程的方式完全模拟浏览器,并需要访问它的各个方面。例如DOM树、js执行等。

我读过phantomjs和casperjs文档,它们似乎不支持dom树。你推荐什么?

正如他们之前所说,Casperjs可以随心所欲地处理domtree的渲染,列出所有的锚、标题、标题等。在过去,你只会使用Python的Beautifulsoup或Perl的TokeParser之类的东西,但这两个都无法应对我们现在看到的繁重的ajax网站。

我会和CasperJs一起查看文档。它是抓取现代网络的最佳工具之一。

最新更新