post #2:)别担心,我不打算把它们都数出来…
是否有一种简单的方法可以使用perl或shell脚本从网站下载pdf文件?如果我有这样一个url:http://www.cs.middlebury.edu/~briggs/Courses/CS201-F12/js/js.pdf实际上,我将有一个cron工作,将运行每天从网站下载pdf文件任何帮助吗?
谢谢
看wget
或curl
。示例:wget <URL> -O <output file>
LWP
模块集有一个精简版LWP::Simple
,它允许这类事情非常简单地完成。
use strict;
use warnings;
use LWP::Simple 'getstore';
my $resp = getstore('http://www.cs.middlebury.edu/~briggs/Courses/CS201-F12/js/js.pdf', 'js.pdf');
print $resp, "n";
$resp
的值是HTTP状态码,正常情况下操作成功应该是200