我想通过编程保存URL,因为我可以手动使用Chrome的保存为。我愿意使用任何工具来实现这一目标。如果无头镀铬不可能,那么头(这是正确的词?:d(解决方案也可以接受。
其他浏览器也可以接受,但请注意,我希望将URL保存为"理智"浏览器保存它。(因为所讨论的URL需要JavaScript渲染,并且也崩溃了。(
请注意,我尝试了Selenium的Page_source;这并没有输出与Chrome保存的内容相同的内容,其结果不完整且与简单的卷发相当。
ps:这是我要保存的URL https://outline.com/zkpuhm。
更新1:
我找到了以下无头解决方案:
https://github.com/abiyani/automate-save-page-as
我在https://splash.readthedocs.io中找到了答案。
安装后,这个小外壳功能确实可以做我想要的:
full-html () {
#doc splash should be up. https://splash.readthedocs.io
#doc 'wait always waits the full time. Should be strictly < timeout.'
curl --silent "http://localhost:8050/render.html?url=$1&timeout=90&wait=${fu_wait:-10}" -o "$2"
}
另请参见:https://github.com/dhamaniasad/headlessbrowsers