在OCR(光学字符识别)之前，您会推荐哪种软件进行图像增强

我们目前正在研究在提交给OCR之前提高图像质量的方法。我们目前使用的OCR引擎是Nuance（v15）的Scansoft API。我们正在研究铅工具，但后来决定寻找其他地方。与Lead Tools相关的许可成本实在是太大了。首先，我们正在寻找简单的图像增强功能，例如：纠偏、去斑、线去除、打孔去除、锐化等。我们运行的是.NET和Java软件的混合，但Java解决方案将是首选。

Kofax 适合预处理，但对于您正在谈论的清理类型来说，除非图像真的很糟糕，否则可能会矫枉过正。除非您的专长是图像处理，否则我建议您与进行图像清理和 OCR 的提供商合作，以便您可以专注于实际增加的价值。

我们从ABBYY（ABBY SDK）获得了OCR开发套件的许可，并发现它在图像处理和OCR方面都非常出色。该 API 非常广泛，示例应用程序、帮助和支持令人印象深刻。我绝对建议看一看。

免责声明：我在Atalasoft工作

我们为 .NET 提供了这些功能和运行时免版税许可。

http://www.atalasoft.com/products/dotimage/

我们还有OCR组件，包括Abbyy，Tesseract等的.NET包装器和可搜索PDF生成（PDF文本顶部的图像）

不确定这是否符合你们需要的标准，但也许您应该查看一些 Paint.Net API。我不知道提取他们的图像处理算法以用于您的项目有多容易，但我相信他们做了一些您正在寻找的事情。此外，它是一个具有 MIT 许可证的开源项目，因此对于商业用途应该非常友好。

关于 KOFAX VRS 的研究 at KOFAX.com

也许是

JMagick，它是ImageMagick的开源Java接口。它以薄Java原生接口（JNI）层的形式实现到ImageMagick API中。它是在 LGPL 下获得许可的，因此在许可证方面应该不是问题。

http://sourceforge.net/projects/jmagick/

我建议英特尔使用零成本运行时许可。

取决于原始图像的数量和质量。托管代码和映像工具包可以工作，但如果要处理数百万个图像，则并不总是最佳解决方案。对于小批量和预算紧张的情况，我同意之前的海报，即像Aforge，Paint.NET 和其他开源计算机视觉库这样的项目可以解决问题。当然，如果结果没有改善，你只能靠自己......至少这可以让您以低成本将您需要的所有内容放在一个应用程序下。

如果您每月处理数十万张图像，那么我建议您将该过程划分为较小的工作流程步骤并调整每个步骤，直到每张图像的成本尽可能接近于零。您会发现 OCR 结果起初迅速上升，然后比您预期的更早趋于平稳。（我不是OCR的忠实粉丝，但它有它的位置）

我使用Recogniform的商业Windows产品，使用针对各种图像调整的脚本，以批处理模式处理和清理OCR之前的图像。如果图像未通过 QC 或被 OCR 引擎拒绝，则使用使用 Atalasoft 工具包构建的自定义 .NET 应用程序手动"修复"。批处理所有内容，只接触失败的内容。

相关内容

最新更新

热门标签：