如何使用wget或curl下载目录中的最新文件?
这似乎很容易,但文件名并不总是可预测的,而且当新数据进入时,它将被随机文件名替换。
具体来说,我希望从中下载数据的目录具有以下命名结构,其中最后一个字符串是随机生成的时间戳:
MRMS_RotationTrackML1440min_00.50_20160530-175837.grib2.gz
MRMS_RotationTrackML1440min_00.50_20160530-182639.grib2.gz
MRMS_RotationTrackML1440min_00.50_20160530-185637.grib2.gz
随机生成的时间戳的格式为:{小时}{分钟}{秒}
有问题的目录如下:http://mrms.ncep.noaa.gov/data/2D/RotationTrackML1440min/
它可能必须是在标题中有内容的东西吗?在这里,你可以使用curl来筛选最后修改的时间戳?
如有任何帮助,我们将不胜感激,提前表示感谢。
您可以定期运行以下命令:
wget -r -nc --level=1 http://mrms.ncep.noaa.gov/data/2D/RotationTrackML1440min/
它将在上次运行后递归下载目录中的任何新内容。