Tesseract较小的PDF输出文件的大小



扫描图像后,可以选择输出低分辨率的pdf图像和文本 pdf 中的图像非常大,以至于 pdf 的大小高达 1 GB。

使用CMD,例如:

tesseract testing/eurotext.png testing/eurotext-eng -l eng pdf

Tesseract使用提供的图像来创建pdf而无需修改=>,如果您的输入图像大小很大=>pdf会很大。 因此,您可以:

  1. 减小输入图像的大小(例如,将 tiff 与 g4 一起使用,调整图像大小......
  2. 使用tesseract生成hocr文件并使用其他工具创建pdf,如hocr2pdf,hocr-pdf...(
  3. 使用一些pdf压缩工具(有在线工具和离线工具,如pdfsizeopt

最新更新