表单识别器是否能够在表单识别器识别工具处理文档之前预先选择/预差异文档?
例如,它将能够在票据或票据之间区分,并且仅使用票据识别工具。
正如其他答案所建议的那样,您可以实现自己的分类器。 您可以调用模型,并检查返回值的置信度分数,如果它太低,则不是您要处理的文档。
如果您想构建 2 个模型,一个用于账单,一个用于笔记,每个模型提取不同的键/值集,那么 Form Recognition 团队正在开发一个功能以找到最适合您的表单,请继续关注。
谢谢
-xin(来自MSFT表格识别团队(
Azure 表单识别器是一种认知服务,它使用机器学习技术从表单文档中识别和提取文本、键/值对和表数据,无论它们是 PNG、JPEG、TIFF 还是 PDF。
使用表单识别器,找不到文档的类型或区分文档。在提取数据之前,您需要训练任何类型的表单。
为了隔离的目的,您必须使用其他一些服务/工具。例如,Azure 计算机视觉服务可用于查找图像的类型。
不,这不是表单识别器的功能。
例如,可以使用自定义视觉实现自己的分类器(用于图像文档(