第一个问题是,例如:
我想从顶级域下载文件(例如。
https://example.com/
),包括来自子域的资源(例如;abc.example.com
),但不来自其他子域,不确定
我发现--domain
选项不执行精确匹配。所以不工作。wget --convert-links --adjust-extension --page-requisites --domains=example.com,abc.expample.com https://example.com/
--domains
和--exclude-domains
在顺序上没有优先级。所以也不像预期的那样。--exclude-domains .example.com --domains=example.com,abc.example.com
那么,第一个问题是
wget
如何包括顶级域和特定子域,而不包括其他子域?
还有一个问题:
我可以写一个
wget
命令行,--span-host
选项仅用于资产文件(js/css/image等,但不是文档)?
我发现——domain选项不执行精确匹配。所以Wget——convert-links——adjust-extension——page- requities——domains=example.com, abc.example.com https://example.com/无法正常工作。
你必须打开--span-hosts
标志,--domains
选项才能工作。
wget --convert-links --adjust-extension --page-requisites --span-hosts --domains=example.com,abc.expample.com https://example.com/