使用Wget/Coll仅下载最新文件



如何使用wget或curl下载目录中的最新文件?

这似乎很容易,但文件名并不总是可预测的,而且当新数据进入时,它将被随机文件名替换。

具体来说,我希望从中下载数据的目录具有以下命名结构,其中最后一个字符串是随机生成的时间戳:

MRMS_RotationTrackML1440min_00.50_20160530-175837.grib2.gz
MRMS_RotationTrackML1440min_00.50_20160530-182639.grib2.gz
MRMS_RotationTrackML1440min_00.50_20160530-185637.grib2.gz

随机生成的时间戳的格式为:{小时}{分钟}{秒}

有问题的目录如下:http://mrms.ncep.noaa.gov/data/2D/RotationTrackML1440min/

它可能必须是在标题中有内容的东西吗?在这里,你可以使用curl来筛选最后修改的时间戳?

如有任何帮助,我们将不胜感激,提前表示感谢。

您可以定期运行以下命令:

wget -r -nc --level=1 http://mrms.ncep.noaa.gov/data/2D/RotationTrackML1440min/

它将在上次运行后递归下载目录中的任何新内容。

相关内容

  • 没有找到相关文章

最新更新