我正在编写一个bash脚本并使用wget从网站检索一些PDF文件。 例如:
wget www.barb.co.uk/news/item-subscriber/id/213/index.html
但是 wget 将文件保存为索引.html。 如果我在浏览器中输入该 URL,它会正确下载真实名称的文件 - "BARB 公告 25 - 12 月 10 日.pdf"。
我怎样才能让wget做同样的事情? 或者有没有另一种方法可以找到文件的真实名称(从 bash 脚本中)?
您可以使用
--content-disposition
选项使wget对HTTP响应的标头进行更复杂的查看,这在大多数情况下会有所帮助。
例:
wget --content-disposition www.barb.co.uk/news/item-subscriber/id/213/index.html
看看 wgets --content-disposition
选项。