我有一个表单解析器处理器设置,我只需要在我的图像中检测到的页面的边界框,我不需要它来做表文本提取。我是否有办法做到这一点(如果有,这会以某种方式减少延迟吗?)目前每页需要5秒。我正在使用python库。
我已经使用python客户端库正确设置了提取。
没有办法只使用Document AI Form Parser执行对象检测(如表检测)。
有几个选项可以得到你想要的:
-
在您的后处理中,您可以在
Document
对象响应中搜索Document.pages.tables
字段的存在,而无需从表中获取数据。然后可以访问Table.layout
字段中的边界框信息。 -
如果延迟是一个问题,并且您只需要Document对象响应中的特定字段,您可以在处理请求中提供
fieldMask
,其中列出了您希望在Document
对象中返回的顶级字段。例如,pages.tables
将只返回pages.tables
字段。- https://cloud.google.com/document-ai/docs/reference/rest/v1/projects.locations.processors/process body.request_body.FIELDS.field_mask
- https://cloud.google.com/document-ai/docs/send-request联机处理机