复制网站以供离线查看,而无需JavaScript(html和.js外部脚本标记)



我正在尝试复制一个网站以供离线查看,没有任何依赖项。

我想复制没有SCRIPT标签(特别是javascript(和没有外部脚本(.js(的HTML。

一直在尝试使用WGET --ignore-tags和 HTTrack 做到这一点,但它没有按预期工作。脚本将作为一个整体进行复制。

在无头模式下调用 Chrome,例如chrome --headless --disable-gpu --dump-dom https://www.chromestatus.com/将转储渲染的 DOM 的 HTML,而无需任何 JavaScript。

这篇文章描述了如何使用无头Chrome和Puppeteer构建爬虫。

最新更新