使用OCR从护照图像中提取键值格式的数据



我的目标是使用基于OCR服务器的解决方案,以键值格式从护照图像中提取数据,以便数据保持原样。我尝试了Azure表单识别器容器(认知服务表单识别器API V1预览版(。但结果并不令人满意,因为根据训练数据创建的模型无法提取任何键值对。我尝试了各种训练样本数据,还参考了https://learn.microsoft.com/en-us/azure/cognitive-services/form-recognizer/build-training-data-set但不起作用

你能指导我如何提取所需格式的数据吗?

或者,是否有人知道.Net中的任何其他服务器上产品、库或解决方案的商业或开源,甚至方法,这些方法最好能在以下方面提供帮助;

非常感谢任何帮助,谢谢

您可以考虑以下内容:

  1. 收集足够的护照样本数据,比如说30张图像,这些图像代表了您将要处理的文件
  2. 决定要提取哪个字段,请使用Form Recognizer的标记工具标记<键,值>配对,建议先标记5-10个文件。训练模型
  3. 使用一些测试图像来测试模型
  4. 分析低精度<键,值>配对并添加更多训练文件。重复3(和4(,直到你得到一个足够好的结果

-xin(MS表单识别器团队(

最新更新