使用.net抓取屏幕



我有大约100K的扫描图像[pdf格式/tif, jpg],需要从中读取数据,然后上传到硬盘驱动器。我计划提供一个小的应用程序,这将有助于自动化数据输入工作。

市场上是否有免费的屏幕抓取工具可以帮助自动化这个过程?

我最初的想法是逐个读取每个图像并通过应用程序提供数据。但是逐个查看并输入数据肯定需要一些时间,并且在读取图像时也有可能出现人为错误。

所有的想法/方法都会很有帮助。

我需要在下周初之前提供一些解决方案。

屏幕抓取是下载网页并从中提取信息。

要从图像中提取文本,需要执行光学字符识别或简称OCR。有许多可用的软件产品可以为您做到这一点。

通过扫描或传真方式创建的PDF文件具有图像内容(它是文本的图片)。如果你的PDF是通过基于文本的应用程序的打印驱动程序创建的(Word打印为PDF,通过"Bullzip"),那么它将具有可以"抓取"的文本内容。我对以前版本的PDFConverter有很好的体验,尽管还有其他产品可以满足您的需求。

最新更新