我可以使用表单解析器只执行表检测,而不是表内容提取?



我有一个表单解析器处理器设置,我只需要在我的图像中检测到的页面的边界框,我不需要它来做表文本提取。我是否有办法做到这一点(如果有,这会以某种方式减少延迟吗?)目前每页需要5秒。我正在使用python库。

我已经使用python客户端库正确设置了提取。

没有办法只使用Document AI Form Parser执行对象检测(如表检测)。

有几个选项可以得到你想要的:

  • 在您的后处理中,您可以在Document对象响应中搜索Document.pages.tables字段的存在,而无需从表中获取数据。然后可以访问Table.layout字段中的边界框信息。

  • 如果延迟是一个问题,并且您只需要Document对象响应中的特定字段,您可以在处理请求中提供fieldMask,其中列出了您希望在Document对象中返回的顶级字段。例如,pages.tables将只返回pages.tables字段。

    • https://cloud.google.com/document-ai/docs/reference/rest/v1/projects.locations.processors/process body.request_body.FIELDS.field_mask
    • https://cloud.google.com/document-ai/docs/send-request联机处理机

相关内容

  • 没有找到相关文章

最新更新