如何在谷歌视觉OCR中获取键值对?



我一直在使用谷歌视觉API从图像中检索文本,输出json文件只包含文本和文本的坐标。有什么方法可以从谷歌视觉OCR获得键值对吗?

谷歌视觉OCR的工作方式是它检测块中的文本以及这些块内的段落。如果您的表采用相同的格式,您只需操作 json 输出即可为您提供键和值对。除此之外,我不认为谷歌视觉OCR可以明确地做你所要求的。

相关内容

  • 没有找到相关文章

最新更新