GoogleCloudVision API我想提高数字的准确性[GAS]

我正在使用CloudVision API进行OCR，但准确率没有从87%提高。我尝试了两种[type]的[features]，[TEXT_DETECTION]和[DOCUMENT_TEXT_DETECTION]。[language Hints]尝试了[la-u-nu-handwrit]、[la-u-kr-latn-digit-handwrit]等，但结果与[en-t-i0-handwriti]相同。如何提高准确性？

requests:[
{
image:{
content: b64
},
features:{
type: "DOCUMENT_TEXT_DETECTION",
},
imageContext:{
languageHints:"la-u-nu-handwrit",
}
}
]
requests:[
{
image:{
content: b64
},
features:{
type: "TEXT_DETECTION",
},
imageContext:{
languageHints:"la-u-kr-latn-digit-handwrite",
}
}
]

为了提高准确性，我建议您也关注图像的质量并进行一些预处理。

一些好的做法是：

请确保图像质量和格式良好。我建议您使用png或tiff格式
如有必要，裁剪图像，删除没有任何文本的部分可能会提高OCR的准确性
使用透视变换。有许多工具可以帮助您进行几何变换，因此可以从正面看到图像。我建议您在Opencv库中使用get透视和warp透视
将图像二值化，并使用黑白图像而不是彩色RGB图像。此外，增加图像的对比度和清晰度可能会有所帮助。如果您正在扫描文本，请尝试将图像分辨率提高到至少300 DPI

希望这能有所帮助！

Manu

相关内容

最新更新

热门标签：