在我的用例中,当执行发票的批处理时,有可能在同一个文件中包含多个发票。
似乎处理的每个文件都被视为单个发票。是否有一种方法可以在特定文件中获得每个发票内容的输出?
我尝试查看Splitter处理器,但它似乎只是在每个拆分页面上提供元数据。
您需要将源文档文件拆分为每个文件包含一个发票,然后您可以将文件发送给文档AI进行批处理。
您可以使用采购文件拆分器&分类器处理器识别分裂点。(处理处理响应的信息)
然后,您可以使用确定的分割点来创建每个文件一个发票的新pdf。您可以使用与PDF一起工作的多个库来完成此操作,并且您可以使用Document AI Toolbox SDK,该SDK具有在Splitter/Classifier Processor处理后拆分PDF文件的内置功能。