以编程方式截取屏幕截图、裁剪部分并运行OCR工具.快速解决方案



我将编写代码,截取屏幕截图,裁剪到屏幕的一小部分(预定义的屏幕区域),然后从裁剪的图像中提取文本(通过OCR工具),然后将生成的文本保存到文件中。我想知道是否有软件(最好是Windows)可以做到这一点,或者至少是其中的一部分。我已经在研究tesseract作为一种OCR工具。任何人都知道可以截图的软件,并可能裁剪图像的预定义区域。谢谢-Jason

我使用Greenshot,这是一个非常棒的屏幕截图工具,根据常见问题解答,它也支持OCR(使用MODI=Microsoft Office Document Imaging)。然而,我从未在我的Windows机器上使用过它,而是使用了Tesseract(对于Linux,有一些脚本经验,这种方法应该也是可行的):

  1. 在这里为Ubuntu/Debian/Windows下载Tesseract并安装它
  2. 下载并安装Greenshot
  3. 创建一个名为";Greenshot_Tessract_OCR.bat";使用诸如记事本或记事本++之类的文本编辑器并将其保存在您选择的位置;C: \Users\MyUser\Scripts\Greenshot_Tessract_OCR.bat"-具有以下内容(取决于tesseract的安装位置):
ECHO OFF
set arg1=%1
"C:Program FilesTesseract-OCRtesseract.exe" "%arg1%" "%arg1%"
type "%arg1%.txt" | clip
  1. 右键单击工具栏中的Greenshot图标;配置外部命令"
  2. 添加一个名称类似";将OCR粘贴到剪贴板";,选择刚刚创建的批处理脚本作为命令和参数,使用默认的"{0}"。然后单击"确定"两次
  3. 你现在应该可以用快捷方式(在我的情况下是"打印"键)和1-2次鼠标点击(取决于你的Greenshot设置)将屏幕截图的文本复制到剪贴板中

您可以尝试以下开源程序:

用于屏幕截图的Greenshot和用于屏幕截图OCR的VietOCR(Tesseract的GUI前端)。