以编程方式截取屏幕截图、裁剪部分并运行OCR工具.快速解决方案

我将编写代码，截取屏幕截图，裁剪到屏幕的一小部分（预定义的屏幕区域），然后从裁剪的图像中提取文本（通过OCR工具），然后将生成的文本保存到文件中。我想知道是否有软件（最好是Windows）可以做到这一点，或者至少是其中的一部分。我已经在研究tesseract作为一种OCR工具。任何人都知道可以截图的软件，并可能裁剪图像的预定义区域。谢谢-Jason

我使用Greenshot，这是一个非常棒的屏幕截图工具，根据常见问题解答，它也支持OCR（使用MODI=Microsoft Office Document Imaging）。然而，我从未在我的Windows机器上使用过它，而是使用了Tesseract（对于Linux，有一些脚本经验，这种方法应该也是可行的）：

在这里为Ubuntu/Debian/Windows下载Tesseract并安装它
下载并安装Greenshot
创建一个名为"；Greenshot_Tessract_OCR.bat"；使用诸如记事本或记事本++之类的文本编辑器并将其保存在您选择的位置；C： \Users\MyUser\Scripts\Greenshot_Tessract_OCR.bat"-具有以下内容（取决于tesseract的安装位置）：

ECHO OFF
set arg1=%1
"C:Program FilesTesseract-OCRtesseract.exe" "%arg1%" "%arg1%"
type "%arg1%.txt" | clip

右键单击工具栏中的Greenshot图标；配置外部命令"
添加一个名称类似"；将OCR粘贴到剪贴板"；，选择刚刚创建的批处理脚本作为命令和参数，使用默认的"{0}"。然后单击"确定"两次
你现在应该可以用快捷方式（在我的情况下是"打印"键）和1-2次鼠标点击（取决于你的Greenshot设置）将屏幕截图的文本复制到剪贴板中

您可以尝试以下开源程序：

用于屏幕截图的Greenshot和用于屏幕截图OCR的VietOCR（Tesseract的GUI前端）。

相关内容

最新更新

热门标签：