MLflow 项目存储但不在 UI 中列出



我在使用 MLflow 服务器时遇到了问题。当我第一次运行命令以在 ec2 实例上启动 mlflow 服务器时,一切正常。现在,尽管日志和工件被存储到 postgres 和 s3 中,但 UI 并未列出这些工件。相反,UI 的项目部分显示:

Loading Artifacts Failed
Unable to list artifacts stored under <s3-location> for the current run. Please contact your tracking server administrator to notify them of this error, which can happen when the tracking server lacks permission to list artifacts under the current run's root artifact directory.

但是当我签入 s3 时,我在错误显示的 s3 位置看到了工件。是什么可能开始导致这种情况,因为它不久前曾经工作过,并且在托管 mlflow 的 ec2 上没有任何变化?

我找到了答案。错误是 mlflow 找不到 boto3,因此 conda 安装有效。这方面的日志被埋葬了,很难在标准输出中找到。

最新更新