我试图分析下面的图像,并使用谷歌云视觉将其转换为文本
我意识到它的质量很低,而且有些单词并不是唯一可识别的。我目前的策略是使用numpy和opencv进行分段。然后,对于每个小节,我使用document_text_detection
函数来获得上面句子的每个小节的结果。然而,这会导致质量极差。我不是在寻找100%的准确度,而是看起来与这行文字相当接近的东西。有什么改进结果的建议吗?除了GCV,还有其他有用的工具吗?
Vision API有一个新的OCR模型可供选择。您可以通过指定模型";内置/最新";。
更多信息请点击此处:https://cloud.google.com/vision/docs/release-notes#January_21_2022
您可以尝试一下Transkribus,据报道它可以在手写历史文档上提供良好的OCR结果。