GoogleCloudVision API我想提高数字的准确性[GAS]



我正在使用CloudVision API进行OCR,但准确率没有从87%提高。我尝试了两种[type]的[features],[TEXT_DETECTION]和[DOCUMENT_TEXT_DETECTION]。[language Hints]尝试了[la-u-nu-handwrit]、[la-u-kr-latn-digit-handwrit]等,但结果与[en-t-i0-handwriti]相同。如何提高准确性?

requests:[
{
image:{
content: b64
},
features:{
type: "DOCUMENT_TEXT_DETECTION",
},
imageContext:{
languageHints:"la-u-nu-handwrit",
}
}
]
requests:[
{
image:{
content: b64
},
features:{
type: "TEXT_DETECTION",
},
imageContext:{
languageHints:"la-u-kr-latn-digit-handwrite",
}
}
]

为了提高准确性,我建议您也关注图像的质量并进行一些预处理。

一些好的做法是:

  • 请确保图像质量和格式良好。我建议您使用png或tiff格式
  • 如有必要,裁剪图像,删除没有任何文本的部分可能会提高OCR的准确性
  • 使用透视变换。有许多工具可以帮助您进行几何变换,因此可以从正面看到图像。我建议您在Opencv库中使用get透视和warp透视
  • 将图像二值化,并使用黑白图像而不是彩色RGB图像。此外,增加图像的对比度和清晰度可能会有所帮助。如果您正在扫描文本,请尝试将图像分辨率提高到至少300 DPI

希望这能有所帮助!

Manu

最新更新