小贝子编程

如何使用Google Vision API(OCR)从图像中的自定义块中提取文本

本文关键字：图像自定义取文本提取 Google 何使用 Vision API OCR ocr google-vision image-text
更新时间 : 2023-09-21
英文 : How to extract texts from customized blocks in a image using Google Vision API(OCR)?

当我们对图像使用谷歌视觉的DOCUMENT_TEXT_DETECTION时，它决定图像中的块和每个块中的文本
在这里，我想得到我定义的块的文本(已经有了一个模型来识别图像中的不同块(
简单地说，我想要由我定义但由谷歌视觉定义的块内的文本
我怎样才能做到这一点

我找到了更好的方法。首先，我垂直合并每个块，在每个块之间可以包含文本分隔符。意思是每个区块之后都有一行文字。因此，我们可以提供这个带有合并块的图像作为Google视觉API的输入。是我们可以获得输入的全文的响应，我们也有之前在块之间设置的文本。所以我们可以用它来分割整个文本。然后我们可以进行分块文本

现在，我决定为给定块的顶点过滤符号。如果有一种方法可以简单地找到相交的符号，那就更好了。因为，现在我要循环浏览每一个符号。

如何使用Google Vision API(OCR)从图像中的自定义块中提取文本

相关内容

最新更新

热门标签：