使用OCR从护照图像中提取键值格式的数据

我的目标是使用基于OCR服务器的解决方案，以键值格式从护照图像中提取数据，以便数据保持原样。我尝试了Azure表单识别器容器(认知服务表单识别器API V1预览版(。但结果并不令人满意，因为根据训练数据创建的模型无法提取任何键值对。我尝试了各种训练样本数据，还参考了https://learn.microsoft.com/en-us/azure/cognitive-services/form-recognizer/build-training-data-set但不起作用

你能指导我如何提取所需格式的数据吗？

或者，是否有人知道.Net中的任何其他服务器上产品、库或解决方案的商业或开源，甚至方法，这些方法最好能在以下方面提供帮助；

非常感谢任何帮助，谢谢

您可以考虑以下内容：

收集足够的护照样本数据，比如说30张图像，这些图像代表了您将要处理的文件
决定要提取哪个字段，请使用Form Recognizer的标记工具标记<键，值>配对，建议先标记5-10个文件。训练模型
使用一些测试图像来测试模型
分析低精度<键，值>配对并添加更多训练文件。重复3(和4(，直到你得到一个足够好的结果

-xin(MS表单识别器团队(

相关内容

最新更新

热门标签：