Google Cloud Vision 是否包含 OCR 后文本更正(可能性)?



我正在互联网上搜索这个问题的答案,但找不到。 我的意思是自动更正之类的东西,或者没有更正,但建议使用更明显的单词。此功能是Google云愿景的一部分,还是我应该为此使用外部程序?

我知道谷歌云视觉也会告诉你一些关于讨论某个话题(医疗、暴力等(的可能性。它是否有内置功能,可以在分析医疗文件时自动使用"医学词典"?例如,当在医学文本中发现"微小"一词时,它是否会将其更改为(或建议将其更改为"半月板"?那么,特定领域的知识是否被使用?

有人知道Microsoft认知服务怎么样吗?

在Google Cloud Vision中,您要求的建议类型目前不受支持,因此您需要一个外部程序来实现它(我不知道(。

由于您正在从图像中提取文本,因此您将获得最有可能实际写入文本的单词(根据 API 的预测模型(,而不是根据主题更有意义的单词。在 API 响应中,您还将获得听录的置信度分数,但对于此特定功能 (DOCUMENT_TEXT_DETECTION(,尚不支持其他结果(替代项(。

最新更新