如何修复通过helm rook安装的Operator pod的拨号tcp 10.96.0.1:443:I/o超时错误

我几乎用这个命令添加了repo

helm repo add rook-stable https://charts.rook.io/stable

然后我运行命令

helm install --namespace rook-ceph-system <NAME> <CHART VERSION>

运算符最初是创建的，但随后会变成一个crashloopbackoff错误。

下面是日志。

kubectl logs  rook-ceph-operator-5bdc9cfcb9-qml5n
2020-02-26 17:42:38.863455 I | rookcmd: starting Rook v0.9.3 with arguments '/usr/local/bin/rook ceph operator'
2020-02-26 17:42:38.863570 I | rookcmd: flag values: --alsologtostderr=false, --help=false, --log-level=INFO, --log_backtrace_at=:0, --log_dir=, --logtostderr=true, --mon-healthcheck-interval=45s, --mon-out-timeout=5m0s, --stderrthreshold=2, --v=0, --vmodule=
2020-02-26 17:42:39.056154 I | cephcmd: starting operator
failed to get pod. Get https://10.96.0.1:443/api/v1/namespaces/default/pods/rook-ceph-operator-5bdc9cfcb9-qml5n: dial tcp 10.96.0.1:443: i/o timeout

你知道怎么解决这个问题吗？

在几乎相同的设置中遇到了同样的问题。Kubernetes集群部署了3个虚拟机(通过流浪者(。Calico作为吊舱网络。

我纠正的问题：在每个/etc/hosts 中声明3个VM主机名

192.168.100.51  kube1   kube1
192.168.100.52  kube2   kube2
192.168.100.53  kube3   kube3

更改pod网络cidr:

kubeadm init --apiserver-advertise-address=192.168.100.51 --apiserver-cert-extra-sans=192.168.100.51 --node-name kube1 --pod-network-cidr=10.10.0.0/16

在印花棉布中使用相同的pod cidr:

- name: CALICO_IPV4POOL_CIDR
value: "10.10.0.0/16"

Rook部署：

git clone --single-branch --branch release-1.2 https://github.com/rook/rook.git
cd cluster/examples/kubernetes/ceph
kubectl create -f common.yaml
kubectl create -f operator.yaml
kubectl create -f cluster-test.yaml

现在Ceph集群已经启动并运行。

经过数小时的谷歌搜索，我就是这样解决的。这是法兰绒初始化期间默认CIDR 10.244.0.0/16的问题。我正在使用运河进行CNI网络连接。我通过从仪表板编辑configmap运河配置或使用kubectl编辑cm-n kube系统kube法兰绒cfg

net-conf.json: |
{
"Network": "10.244.0.0/16",
"Backend": {
"Type": "vxlan"
}
}

使用kubectl get nodes -o jsonpath='{.items[*].spec.podCIDR}'获取吊舱CIDR。#从10.244.0.0/16更改为您自己的POD网络。然后删除运河吊舱。署名：陈军

相关内容

最新更新

热门标签：