我想获得有关k8s cronjob时间的信息。我的k8s程序中有很多作业。因此,很难统计他们专注于什么时间。我想平均分配我的工作。有没有办法计算cronjob时间或按时间排序?
我试图找到一个合适的工具来帮助您的案例。不幸的是,我没有同时找到任何合适且易于使用的东西。
可以使用Prometheus + Grafana
来监控CronJobs
,例如使用这个Kubernetes Cron和Batch Job监控面板
但是,我认为您不会通过这种方式找到任何有用的信息,只是一个显示集群中CronJobs
数量的仪表板。
因此,我决定编写一个Bash脚本,该脚本能够以可读的方式显示最后几次运行的CronJobs
。
如Kubernetes CronJob文档中所述:
CronJob按重复计划创建作业。
要了解特定作业运行的时间,我们可以检查其startTime
和completionTime
,例如使用以下命令:
# kubectl get job <JOB_NAME> --template '{{.status.startTime}}' # "startTime"
# kubectl get job <JOB_NAME> --template '{{.status.completionTime}}' # "completionTime"
要获得以秒为单位的Jobs
的持续时间,我们可以将startTime
和completionTime
日期转换为epoch:
# date -d "<SOME_DATE> +%s
这是整个Bash脚本:
注意:我们需要将命名空间名称作为参数传递。
#!/bin/bash
# script name: cronjobs_timetable.sh <NAMESPACE>
namespace=$1
for cronjob_name in $(kubectl get cronjobs -n $namespace --template '{{range .items}}{{.metadata.name}}{{"n"}}{{end}}'); do
echo "===== CRONJOB_NAME: ${cronjob_name} ==========="
printf "%-15s %-15s %-15s %-15sn" "START_TIME" "COMPLETION_TIME" "DURATION" "JOB_NAME"
for job_name in $(kubectl get jobs -n $namespace --template '{{range .items}}{{.metadata.name}}{{"n"}}{{end}}' | grep -w "${cronjob_name}-[0-9]*$"); do
startTime="$(kubectl get job ${job_name} -n $namespace --template '{{.status.startTime}}')"
completionTime="$(kubectl get job ${job_name} -n $namespace --template '{{.status.completionTime}}')"
if [[ "$completionTime" == "<no value>" ]]; then
continue
fi
duration=$[ $(date -d "$completionTime" +%s) - $(date -d "$startTime" +%s) ]
printf "%-15s %-15s %-15s %-15sn" "$(date -d ${startTime} +%X)" "$(date -d ${completionTime} +%X)" "${duration} s" "$job_name"
done
done
默认情况下,此脚本只显示最后三个Jobs
,但可以在作业配置中使用.spec.successfulJobsHistoryLimit
和.spec.failedJobsHistoryLimit
字段对其进行修改(有关更多信息,请参阅Kubernetes作业历史限制(
我们可以检查它是如何工作的:
$ ./cronjobs_timetable.sh default
===== CRONJOB_NAME: hello ===========
START_TIME COMPLETION_TIME DURATION JOB_NAME
02:23:00 PM 02:23:12 PM 12 s hello-1616077380
02:24:02 PM 02:24:13 PM 11 s hello-1616077440
02:25:03 PM 02:25:15 PM 12 s hello-1616077500
===== CRONJOB_NAME: hello-2 ===========
START_TIME COMPLETION_TIME DURATION JOB_NAME
02:23:01 PM 02:23:23 PM 22 s hello-2-1616077380
02:24:02 PM 02:24:24 PM 22 s hello-2-1616077440
02:25:03 PM 02:25:25 PM 22 s hello-2-1616077500
===== CRONJOB_NAME: hello-3 ===========
START_TIME COMPLETION_TIME DURATION JOB_NAME
02:23:01 PM 02:23:32 PM 31 s hello-3-1616077380
02:24:02 PM 02:24:34 PM 32 s hello-3-1616077440
02:25:03 PM 02:25:35 PM 32 s hello-3-1616077500
===== CRONJOB_NAME: hello-4 ===========
START_TIME COMPLETION_TIME DURATION JOB_NAME
02:23:01 PM 02:23:44 PM 43 s hello-4-1616077380
02:24:02 PM 02:24:44 PM 42 s hello-4-1616077440
02:25:03 PM 02:25:45 PM 42 s hello-4-1616077500
此外,您可能希望创建异常和错误处理,以使此脚本在所有情况下都能按预期工作。