GCP 上的 Kubeflow 管道错误 - 运行没有结束



提交"run"使用Jupyter笔记本,当我进入Kubeflow管道仪表板时,我可以看到我的"运行"。提交,跑了几个小时也跑不完也没有显示任何日志

我试过运行"DEMO XG-BOOST"但同样的问题依然存在。"run"不会结束。

有没有人可以帮我了解一下,如果有任何问题与帐户设置或任何其他问题,我错过了,因为我已经试图检查文档&其他网站,但无法理解为什么会发生这种情况。

请注意这个"运行"使用quicklabs (Covertype分类器)在coursera上运行良好(创建管道流)

错误快照使用以下版本:KFP 1.8.12;kfp-pipeline-spec 0.1.14;kfp-server-api 1.8.1;Python 3.7.12

如果还有其他信息我没有在上面写,请让我知道,这样我就可以分享这些信息,可以帮助我们解决这个问题。

上述问题已解决。DEMO XG-BOOST"通过选择"使用特使执行器"解决了"运行不结束"问题。选项。

见快照

当我们用这个设置启动管道时,它解决了这个问题&我们现在可以运行完整的管道。

更多细节:我们得到了GCP &他们提到这个问题可能是由于最近升级了GKE集群,删除了docker运行时(https://www.kubeflow.org/docs/components/pipelines/installation/choose-executor/#docker-executor)。也就是说,Docker执行器是默认的工作流执行器,并且依赖于Docker容器运行时,这在Kubernetes 1.20+中已被弃用。我们使用的是版本为1.21.6的GKE集群。这就是问题所在。因此,我们使用了文档(https://www.kubeflow.org/docs/components/pipelines/installation/choose-executor/#migrate-to-emissary-executor) &已经迁移到使者执行器(而不是Docker),这已经解决了我们的问题。

相关内容

  • 没有找到相关文章

最新更新