如何在 AWS EC2 上找到 100% CPU 利用率的原因?



我有 EC2 实例队列:A 和 B(两者都位于相同的 AWS 账户、相同的 Linux 操作系统版本、相同的区域,但不同的可用区和不同的负载均衡下(。 当我为 EC2 实例 A 和 B 队列提供相同的负载时;两者的行为不同。 EC2 A 工作正常,平均 CPU 利用率高达 60% ;另一方面,EC2 B 显示 CPU 利用率峰值高达 100%,然后它从 0 重新开始,并且在队列中的其他实例中发现相同的努力。

过去有人经历过这种情况吗?

ssh 到主机 B,通过 top 查看系统活动,查找消耗大部分 CPU 的进程。 您也可以使用"LSOF"命令或检查该过程 ps -fp"过程的 PID">

经过分析,发现有几个安全补丁被执行;这导致了这些峰值。

在运行EC2的MS Server实例中,这种情况已经发生在我身上两次。在这两种情况下,都是MS更新服务占用了100%的CPU,并烧掉了我所有的CPU积分。

重新开始并修复它的唯一方法是设置"实例 T2/T3 无限制"并停止/禁用 MS 更新服务。

最新更新