GCP Vertex AI中的批处理预测



在GCP Vertex AI中为AutoML模型尝试批处理预测时,批处理预测结果跨越了几个文件(从用户的角度来看这并不方便)。如果它是单个批处理预测结果文件,即覆盖单个文件中的所有记录,则会使过程简单得多。

例如,我的输入数据集文件中有5585条记录。批处理预测结果由21个文件组成,其中每个文件有200-300条记录,因此总共覆盖5585条记录。

对图像、文本、视频、表格AutoML模型进行批处理预测,使用分布式处理来运行作业,这意味着数据分布在任意虚拟机集群中,并以不可预测的顺序进行处理,因此您将获得存储在云存储中的各种文件中的预测结果。由于批处理预测输出文件的生成顺序与输入文件不同,因此已经提出了一个特性请求,您可以从此链接跟踪该请求的更新。

我们目前无法提供预计到达时间,但您可以在问题跟踪器中跟踪进度,您可以"STAR"问题以接收自动更新,并通过参考此链接给予牵引力。

但是,如果您正在为表格式AutoML模型进行批处理预测,那么您可以选择BigQuery作为存储,其中所有预测输出将存储在单个表中,然后您可以将表数据导出到单个CSV文件。

相关内容

  • 没有找到相关文章

最新更新