如何在DocumentAI中批量发送文档?



我正在使用此处示例中的费用解析器执行processDocument处理。由于账单费用太大,我没有将10个文档逐个发送,而是将10个文档合并成一个pdf并再次使用processDocument。然而,DocumentAI看到10个单独的收据,我们将它们组合成一个收据,并且为每个收据返回10个不同的total_amount实体,而不是1个total_amount实体。我想把10个文档合并成一个pdf然后发送,这样可以减少账单费用。此外,我正在寻找一种方法来独立地考虑每个文档,并分别提取其实体。批处理对我有用吗?我能做些什么呢?你能帮我一下吗?

不幸的是,没有办法使账单更便宜,因为文档AI的定价是按每页/文档计算的。参见文档AI定价

关于你的问题:

我正在寻找一种方法来独立地思考每个文档并分别提取其实体。将批量处理为我工作?

是的,批量处理将适用于您,但价格与processDocument相同。请看我在上面附上的定价信息。

批处理和processDocument之间的唯一区别是,批处理将在单个请求中发送所有文档,而不是为单个文档发送单个请求。然后,响应将存储在您在批处理选项上定义的GCS桶中。参见批处理示例代码。

另一个要添加的东西是批处理异步处理文档。这意味着当发送请求时,处理在后端完成,您可以轮询请求的状态,以查看它是否仍在处理或已完成。

相关内容

  • 没有找到相关文章

最新更新