如何在无头服务器中使用Chrome保存URL



我想通过编程保存URL,因为我可以手动使用Chrome的保存为。我愿意使用任何工具来实现这一目标。如果无头镀铬不可能,那么头(这是正确的词?:d(解决方案也可以接受。

其他浏览器也可以接受,但请注意,我希望将URL保存为"理智"浏览器保存它。(因为所讨论的URL需要JavaScript渲染,并且也崩溃了。(

请注意,我尝试了Selenium的Page_source;这并没有输出与Chrome保存的内容相同的内容,其结果不完整且与简单的卷发相当。

ps:这是我要保存的URL https://outline.com/zkpuhm。

更新1:

我找到了以下无头解决方案:

https://github.com/abiyani/automate-save-page-as

我在https://splash.readthedocs.io中找到了答案。

安装后,这个小外壳功能确实可以做我想要的:

full-html () {
    #doc splash should be up. https://splash.readthedocs.io
    #doc 'wait always waits the full time. Should be strictly < timeout.'
    curl --silent "http://localhost:8050/render.html?url=$1&timeout=90&wait=${fu_wait:-10}" -o "$2"
}

另请参见:https://github.com/dhamaniasad/headlessbrowsers

相关内容

  • 没有找到相关文章

最新更新