Ghostscript PDF到TIFF设置输出大小c#



我有一个22页的pdf。我正在使用GhostScript将PDF转换为TIFF以供Tesseract使用。我做到了。。。

  string filename=openFileDialog1.FileName;
  using (GhostscriptRasterizer rasterizer = new GhostscriptRasterizer())
            {
                rasterizer.Open(filename, _lastInstalledVersion, false);
                for (int pageNumber = 1; pageNumber <= rasterizer.PageCount; pageNumber++)
                {
                  Image img = rasterizer.GetPage(400, 400, pageNumber);  
                }

我想在传递给Tesseract使用之前设置img大小,但我不能。。有办法吗?

有一个例子:但是idk,如果我可以通过pdf中的每个图像由Tesseract 使用

  GhostscriptVersionInfo gv = GhostscriptVersionInfo.GetLastInstalledVersion();
        using (GhostscriptProcessor processor = new GhostscriptProcessor(gv, true))
        {
            processor.Processing += new GhostscriptProcessorProcessingEventHandler(processor_Processing);
            List<string> switches = new List<string>();
            switches.Add("-empty");
            switches.Add("-dSAFER");
            switches.Add("-dBATCH");
            switches.Add("-dNOPAUSE");
            switches.Add("-dNOPROMPT");
            switches.Add(@"-sFONTPATH=" + System.Environment.GetFolderPath(System.Environment.SpecialFolder.Fonts));
            switches.Add("-dFirstPage=" + pageFrom.ToString());
            switches.Add("-dLastPage=" + pageTo.ToString());
            switches.Add("-sDEVICE=png16m");
            switches.Add("-r96");
            switches.Add("-dTextAlphaBits=4");
            switches.Add("-dGraphicsAlphaBits=4");
            //switches.Add("-sDEVICE=pdfwrite");
            switches.Add(@"-sOutputFile=" + outputFile);
            switches.Add(@"-f");
            switches.Add(inputFile);
            processor.StartProcessing(switches.ToArray(), null);
        }
    }

-dDEVICEWITHDPOINTS和-dDEVICEHIGHTPOINTS以及-dFIXEDMEDIA将设置特定的介质大小。您可能还需要设置-dPDFFitPage来将内容扩展到新媒体上。

你不能直接使用Ghostscript,你是在使用jhabjan的Ghostscript.net吗?

最新更新