例如,通过执行以下命令: http://:8088/ws/v1/cluster/metrics
我得到这样的输出:
{
"clusterMetrics": {
"appsSubmitted": 502521,
"appsCompleted": 501201,
"appsPending": 0,
"appsRunning": 19,
"appsFailed": 454,
"appsKilled": 847,
"reservedMB": 140400,
"availableMB": 12615232,
"allocatedMB": 8830800,
"reservedVirtualCores": 39,
"availableVirtualCores": 6140,
"allocatedVirtualCores": 2065,
"containersAllocated": 1692,
"containersReserved": 39,
"containersPending": 3960,
"totalMB": 21446032,
"totalVirtualCores": 8205,
"totalNodes": 199,
"lostNodes": 1,
"unhealthyNodes": 1,
"decommissionedNodes": 8,
"rebootedNodes": 0,
"activeNodes": 189
}
}
例如,分配的MB意味着什么? 它是瞬时值吗? 它是在间隔期内的平均值吗?间隔是可配置的吗?
分配的 MB 是已分配给 vcore 的内存(尽管不一定使用)。 是的,这是一个瞬时值。 没有间隔,它是群集在该时刻的快照(减去从资源管理器中的数据结构计算这些值,然后通过 REST API 返回所需的时间)。
如果你想翻译你的指标,它会说:
- 您当前有 19 个应用正在运行。
- 这 19 个应用总共使用 2065 个 vcore。
- 这 2065 个 vcore 已为其保留了 8830800 MB 内存