我使用GKE已经一年多了,在stackdriver日志记录/监控方面从未遇到过任何问题。但是,当我创建了版本为1.15.9-gke.26的新集群时,我在stackdriver中没有看到任何日志(这两个指标都没有(。它也不适用于1.14版本的新集群。尽管它适用于从1.13更新到1.14版本的旧集群。
部分设置:
gke版本=1.15.9-gke.26
Stackdriver Kubernetes引擎监控=系统和工作负载日志记录和监控
VPC本机(别名IP(=已启用
工作负载标识=已禁用
奇怪的事情:
以下守护程序集有0/0个pod(守护程序集没有选择节点(:
-metadata-proxy-v0.1
-nvidia gpu设备插件(听起来没用(
我不确定stackdriver到底是如何工作的,以及如何调试它…我会感谢的任何提示
当前在集群上运行的部署和守护程序集:
kubectl get daemonsets,deployments --all-namespaces
NAMESPACE NAME DESIRED CURRENT READY UP-TO-DATE AVAILABLE NODE SELECTOR AGE
kube-system daemonset.extensions/fluentd-gcp-v3.1.1 3 3 3 3 3 beta.kubernetes.io/fluentd-ds-ready=true,beta.kubernetes.io/os=linux 16h
kube-system daemonset.extensions/metadata-proxy-v0.1 0 0 0 0 0 beta.kubernetes.io/metadata-proxy-ready=true,beta.kubernetes.io/os=linux 16h
kube-system daemonset.extensions/nvidia-gpu-device-plugin 0 0 0 0 0 <none> 16h
kube-system daemonset.extensions/prometheus-to-sd 3 3 3 3 3 beta.kubernetes.io/os=linux 16h
NAMESPACE NAME READY UP-TO-DATE AVAILABLE AGE
kube-system deployment.extensions/event-exporter-v0.3.0 1/1 1 1 16h
kube-system deployment.extensions/fluentd-gcp-scaler 1/1 1 1 16h
kube-system deployment.extensions/heapster-gke 1/1 1 1 16h
kube-system deployment.extensions/kube-dns 2/2 2 2 16h
kube-system deployment.extensions/kube-dns-autoscaler 1/1 1 1 16h
kube-system deployment.extensions/l7-default-backend 1/1 1 1 16h
kube-system deployment.extensions/metrics-server-v0.3.3 1/1 1 1 16h
kube-system deployment.extensions/stackdriver-metadata-agent-cluster-level 1/1 1 1 16h
根据文档,正如@Darshan Naik所提到的:
如果您使用的是旧版日志记录和监控,则必须切换到Kubernetes引擎监控,然后才能删除对旧版日志和监控的支持。从GKE 1.15起,将不再支持传统的日志记录和监控。
https://cloud.google.com/monitoring/kubernetes-engine#select