如何使用Google Vision API(OCR)从图像中的自定义块中提取文本


  • 当我们对图像使用谷歌视觉的DOCUMENT_TEXT_DETECTION时,它决定图像中的块和每个块中的文本
  • 在这里,我想得到我定义的块的文本(已经有了一个模型来识别图像中的不同块(
  • 简单地说,我想要由我定义但由谷歌视觉定义的块内的文本
  • 我怎样才能做到这一点

我找到了更好的方法。首先,我垂直合并每个块,在每个块之间可以包含文本分隔符。意思是每个区块之后都有一行文字。因此,我们可以提供这个带有合并块的图像作为Google视觉API的输入。是我们可以获得输入的全文的响应,我们也有之前在块之间设置的文本。所以我们可以用它来分割整个文本。然后我们可以进行分块文本

现在,我决定为给定块的顶点过滤符号。如果有一种方法可以简单地找到相交的符号,那就更好了。因为,现在我要循环浏览每一个符号。

最新更新