小贝子编程

谷歌视觉实现更好OCR的理想图像尺寸是多少

本文关键字：图像多少理想视觉实现更好 OCR 谷歌 image-processing ocr azure-cognitive-services google-vision image-preprocessing
更新时间 : 2023-09-18
英文 : What is the Ideal image dimensions for better OCR by google vision?

我使用谷歌视觉OCR已经有一段时间了。我观察到OCR结果随图像尺寸的变化而变化。例如，尺寸为720 x 1280的图像比360 x 720的图像效果更好。有时情况会更糟。

我对微软的OCR API也有同样的体验。

那么，有没有一个理想的图像尺寸总是能给出良好的OCR结果呢？图像尺寸如何影响OCR结果？

请参考此处获取信息：谷歌支持的图像

FACE_DETECTION1600 x 1200眼睛之间的距离是最重要的

LANDMARK_DETECTION640 x 480

LOGO_DETECTION640 x 480

LABEL_DETECTION640 x 480

TEXT_DETECTION和DOCUMENT_TEXT_DETECTION1024 x 768OCR需要更多检测字符的分辨率

SAFE_SEARCH_DECTION640 x 480

谷歌支持的图像

基于下面的链接，不仅分辨率，纵横比也是一个因素https://www.mlreader.com/prepare-image-for-google-vision-api

相关内容