PDF到PNG使用鬼脚本 - 裁剪到页面的上三分之一



我正在尝试将PDF文件转换为图像,并在此过程中裁剪到第一页顶部的前三分之一(大约(。

此命令为我提供了整个页面,如果我使值变小,则更改 -g 选项会裁剪到左下角。

对于 (*( 中的 %%x 执行 "......\program\gs\gs9.23\bin\gswin32c.exe" -g2500x3300 -dFIXEDMEDIA -dMaxBitmap=500000000 -dAlignToPixels=0 -dGridFitTT=2 -sDEVICE=pngalpha -dTextAlphaBits=4 -dGraphicsAlphaBits=4 -r300x300 -dBATCH -dNOPAUSE -dFirstPage=1 -dLastPage=1 -SOutputFile="%%~nx.png" "%%~nx.pdf"

我想要较小的图像,以便图像上的 OCR 更快,并且我正在处理的大多数信件/文档在前三分之一都有我想要的信息。

PostScript 页面(和 PDF 页面(的原点 (0, 0( 位于左下角。因此,通过减小媒体大小,可以使内容的最上层位于媒体之外,因此不会呈现。

因此,您需要做的是减小媒体的大小(您已经完成(**并*翻译源,以便内容的顶部位于媒体上。

尝试在输入PDF文件之前添加-c "<</BeginPage {-300 0 translate}>> setpagedevice" -f。这应该将原点转换为 300 dpi 的媒体底部下方 1 英寸,这应该使页面顶部多 1 英寸,页面底部少 1 英寸。

显然,由于我不知道您的内容有多大,因此我无法给您确切的答案。

最新更新