将PDF转换为PNG具有相同的分辨率- Imagemagick



我有1000多个PDF,每个PDF都有不同的分辨率(基于用于扫描它们的扫描仪)。我想将PDF的每一页转换为PNG,将其传递给Tesseract进行OCR。我使用Imagemagick转换为PNG,但必须为所有图像传递固定的DPI才能获得良好的可读输出。是否有一种方法可以让我在转换每个PDF的同时保持PDF的分辨率?

例如,如果1.PDF的分辨率为622 × 788,而2.pdf的分辨率为792 × 612,我希望以相同的分辨率进行精确的转换,只是使用不同的格式(PNG)。

我现在使用的命令是:

convert -monochrome -density 1200 input.pdf -resize 25% -monochrome -white-threshold 50% -black-threshold -50% output.png

谢谢,pashah

也许读取第一个页面的几何形状,然后调整所有页面的大小以匹配?

SIZE=$(identify -format '%g' input.pdf)
convert  -monochrome 
         -density 1200 
         -resize $SIZE 
         -white-threshold 50% 
         -black-threshold -50% 
         -append 
         output.png

相关内容

  • 没有找到相关文章

最新更新