我使用谷歌视觉OCR已经有一段时间了。我观察到OCR结果随图像尺寸的变化而变化。例如,尺寸为720 x 1280的图像比360 x 720的图像效果更好。有时情况会更糟。
我对微软的OCR API也有同样的体验。
那么,有没有一个理想的图像尺寸总是能给出良好的OCR结果呢?图像尺寸如何影响OCR结果?
请参考此处获取信息:谷歌支持的图像
FACE_DETECTION1600 x 1200眼睛之间的距离是最重要的
LANDMARK_DETECTION640 x 480
LOGO_DETECTION640 x 480
LABEL_DETECTION640 x 480
TEXT_DETECTION和DOCUMENT_TEXT_DETECTION1024 x 768OCR需要更多检测字符的分辨率
SAFE_SEARCH_DECTION640 x 480
谷歌支持的图像
基于下面的链接,不仅分辨率,纵横比也是一个因素https://www.mlreader.com/prepare-image-for-google-vision-api