kubeflow部署gcp端点控制器失败



我正试图使用官方指南在gcp上部署kubeflowhttps://www.kubeflow.org/docs/distributions/gke/deploy/deploy-cli/

我试了三次,但端点控制器似乎有问题。检查人:kubectl-n kubeflow获取所有

除外,所有吊舱都在运行

    NAME                                                             READY   STATUS             RESTARTS   AGE
pod/admission-webhook-deployment-667bd68d94                1/1     Running            
pod/cache-deployer-deployment-75ccdc98b4                   2/2     Running            
pod/cache-server-56f78bf64b                                2/2     Running            
pod/centraldashboard-5fdbd9b744                            1/1     Running            
pod/cloud-endpoints-controller-5f7dbc6fc8                  0/1     ImagePullBackOff

播客描述称,它未能解决引用";gcr.io/云解决方案组/云端点控制器:0.2.1〃:意外状态代码〔清单0.2.1〕:403禁止

我是kubeflow的新手,但尽管重试了三次,结果总是一样。

您可以自己克隆repo并构建映像,然后将其推送到容器注册表中。这是一种解决方法,可以在官方图像返回之前解决此问题。

git clone https://github.com/jlewi/cloud-endpoints-controller.git
cd cloud-endpoints-controller
git checkout 0.2.1
docker build . -t <YOUR DOCKER REGISTRY>/cloud-endpoints-controller:0.2.1
docker push <YOUR DOCKER REGISTRY>/cloud-endpoints-controller:0.2.1

这使用你的吊舱规范中的新图像。

紧急发布:https://github.com/kubeflow/gcp-blueprints/releases/tag/v1.4.1,现在可以使用v1.4.1标签进行部署。

----原件-----

感谢您发布本期文章!我在这里发布了一个缓解解决方案https://github.com/kubeflow/gcp-blueprints/issues/343#issuecomment-1028488756.我计划在即将发布的版本中修复此问题。

最新更新