使用wkhtmltopdf拉取单个页面



我正在尝试将HTML页面转换为文档,但它们都在单独的页面上,例如

http://www.website.co.uk/example/html5forwebkit.html?page=32

如果我运行标准命令,我只是得到一个页面,是否有一个快捷的命令拉我需要的每一页?有450页,我希望它们都在同一个PDF文件

你可以做的是创建一个循环,使用wkhtmltopdf创建每个页面的PDF,然后使用pdfunite将这些单独的PDF合并在一起。

# Change the values to your liking
#            ↓  ↓↓↓
for page in {1..450};do
wkhtmltopdf "http://www.website.co.uk/example/html5forwebkit.html?page=$page" page_$page.pdf
# Optional 'sleep' so that you dont end up DOSing the site
sleep 0.5
done
# Merge the PDFs into one
pdfunite page_*.pdf out.pdf

最新更新