我一直在使用谷歌视觉API从图像中检索文本,输出json文件只包含文本和文本的坐标。有什么方法可以从谷歌视觉OCR获得键值对吗?
谷歌视觉OCR的工作方式是它检测块中的文本以及这些块内的段落。如果您的表采用相同的格式,您只需操作 json 输出即可为您提供键和值对。除此之外,我不认为谷歌视觉OCR可以明确地做你所要求的。
我一直在使用谷歌视觉API从图像中检索文本,输出json文件只包含文本和文本的坐标。有什么方法可以从谷歌视觉OCR获得键值对吗?
谷歌视觉OCR的工作方式是它检测块中的文本以及这些块内的段落。如果您的表采用相同的格式,您只需操作 json 输出即可为您提供键和值对。除此之外,我不认为谷歌视觉OCR可以明确地做你所要求的。
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium