在OCR(光学字符识别)之前,您会推荐哪种软件进行图像增强



我们目前正在研究在提交给OCR之前提高图像质量的方法。 我们目前使用的OCR引擎是Nuance(v15)的Scansoft API。 我们正在研究铅工具,但后来决定寻找其他地方。 与Lead Tools相关的许可成本实在是太大了。 首先,我们正在寻找简单的图像增强功能,例如:纠偏、去斑、线去除、打孔去除、锐化等。 我们运行的是.NET和Java软件的混合,但Java解决方案将是首选。

Kofax 适合预处理,但对于您正在谈论的清理类型来说,除非图像真的很糟糕,否则可能会矫枉过正。 除非您的专长是图像处理,否则我建议您与进行图像清理和 OCR 的提供商合作,以便您可以专注于实际增加的价值。

我们从ABBYY(ABBY SDK)获得了OCR开发套件的许可,并发现它在图像处理和OCR方面都非常出色。 该 API 非常广泛,示例应用程序、帮助和支持令人印象深刻。 我绝对建议看一看。

免责声明:我在Atalasoft工作

我们为 .NET 提供了这些功能和运行时免版税许可。

http://www.atalasoft.com/products/dotimage/

我们还有OCR组件,包括Abbyy,Tesseract等的.NET包装器和可搜索PDF生成(PDF文本顶部的图像)

不确定这是否符合你们需要的标准,但也许您应该查看一些 Paint.Net API。 我不知道提取他们的图像处理算法以用于您的项目有多容易,但我相信他们做了一些您正在寻找的事情。 此外,它是一个具有 MIT 许可证的开源项目,因此对于商业用途应该非常友好。

关于 KOFAX VRS 的研究 at KOFAX.com

也许是

JMagick,它是ImageMagick的开源Java接口。它以薄Java原生接口(JNI)层的形式实现到ImageMagick API中。它是在 LGPL 下获得许可的,因此在许可证方面应该不是问题。

http://sourceforge.net/projects/jmagick/

我建议英特尔使用零成本运行时许可。

取决于原始图像的数量和质量。托管代码和映像工具包可以工作,但如果要处理数百万个图像,则并不总是最佳解决方案。对于小批量和预算紧张的情况,我同意之前的海报,即像Aforge,Paint.NET 和其他开源计算机视觉库这样的项目可以解决问题。 当然,如果结果没有改善,你只能靠自己......至少这可以让您以低成本将您需要的所有内容放在一个应用程序下。

如果您每月处理数十万张图像,那么我建议您将该过程划分为较小的工作流程步骤并调整每个步骤,直到每张图像的成本尽可能接近于零。 您会发现 OCR 结果起初迅速上升,然后比您预期的更早趋于平稳。(我不是OCR的忠实粉丝,但它有它的位置)

我使用Recogniform的商业Windows产品,使用针对各种图像调整的脚本,以批处理模式处理和清理OCR之前的图像。 如果图像未通过 QC 或被 OCR 引擎拒绝,则使用使用 Atalasoft 工具包构建的自定义 .NET 应用程序手动"修复"。 批处理所有内容,只接触失败的内容。

最新更新