谷歌视觉实现更好OCR的理想图像尺寸是多少



我使用谷歌视觉OCR已经有一段时间了。我观察到OCR结果随图像尺寸的变化而变化。例如,尺寸为720 x 1280的图像比360 x 720的图像效果更好。有时情况会更糟。

我对微软的OCR API也有同样的体验。

那么,有没有一个理想的图像尺寸总是能给出良好的OCR结果呢?图像尺寸如何影响OCR结果?

请参考此处获取信息:谷歌支持的图像

FACE_DETECTION1600 x 1200眼睛之间的距离是最重要的

LANDMARK_DETECTION640 x 480

LOGO_DETECTION640 x 480

LABEL_DETECTION640 x 480

TEXT_DETECTION和DOCUMENT_TEXT_DETECTION1024 x 768OCR需要更多检测字符的分辨率

SAFE_SEARCH_DECTION640 x 480

谷歌支持的图像

基于下面的链接,不仅分辨率,纵横比也是一个因素https://www.mlreader.com/prepare-image-for-google-vision-api

相关内容

  • 没有找到相关文章

最新更新