如何下载静态网站与WGET包括其CSS,JS,图片在单独的文件夹



网站从其他域加载其资产&我根本无法下载这些资产。(JS、CSS、图像等(

假设网站是example.com&它包括来自assets.orange.com的资产。

我如何告诉WGET下载这些资产,将其保存到不同的文件夹(js、css、images(中,并转换下载的HTML文件中的链接?

我不知道我做错了什么;在此命令中指定assets.orange.com

wget 
--mirror 
--recursive 
--no-clobber 
--page-requisites 
--html-extension 
--convert-links 
--restrict-file-names=windows 
--domains example.com 
--no-parent 
example.com

在此命令中指定assets.orange.com的位置

wget手册说--domains的使用是

-D domain-list
--domains=domain-list

其中域列表是一个逗号分隔的域列表,所以如果你想指定多个域,你应该执行

--domains=example.com,assets.orange.com

根据wget手册,如果您的目标是下载正确显示给定HTML页面所需的所有文件,则可以使用

-p
--page-requisites

注意这包括内联图像、声音和引用的样式表

最新更新