我正在分析java服务器。我正在看火焰图:http://www.brendangregg.com/flamegraphs.html。我有几个关于如何解释火焰剖面的问题。 我是Java的新手,所以它们听起来可能很基础。
1(在配置文件中,我观察到的顶部框架libjvm_so占用38.6%的CPU。这在java进程和服务器中正常吗?这个共享对象到底是什么,它通常需要这么多的处理吗?
2(函数/堆栈取x%是什么意思。这是相对的还是绝对的?按进程划分的总 CPU 使用率的 x% 或 x% CPU。这让我想到了我的第二个问题,当我比较 2 个火焰图时,是否通过进程的所有 CPU 使用率来比较规范化?也就是说,如果一个方法在一个配置文件中占用 10%,在另一个配置文件中占用 15%,这是否意味着该函数实际上消耗了更多的 CPU。或者可能是初始进程的整体CPU使用率为50%,但在第二个进程中CPU使用率为30%,因此从绝对值来看,第二个配置文件显示该功能的CPU使用率降低。( 50% 的 10% 大于 30% 的 15%(。
对于问题 1:
我认为 libjvm.so 包括进行编译和垃圾收集所花费的时间。如果进程的 CPU 利用率较高,并且进程已经运行了一段时间,则通常可能不会在 libjvm.so 中花费大量 CPU 时间,因此可能表示进程在 GC 或编译中花费的时间比预期的要长。如果在进程启动时收集了配置文件(因此将更多时间用于编译(,则可能会发生这种情况。
对于问题 2:
火焰图中的百分比通常是指进程使用的总 CPU 的百分比。因此,如果配置文件显示 5 秒的总 CPU 时间,则使用 1 秒 CPU 时间的方法将显示为使用所有 CPU 时间的 20%。
堆栈驱动程序探查器收集的 CPU 配置文件是在 10 秒的持续时间内收集的,可用于了解进程使用的 CPU 百分比。例如,当进程使用 ~50% 的 CPU 时,收集了总计为 5s 的配置文件。
对于堆栈驱动程序探查器中的配置文件比较,火焰图由两个配置文件中 CPU 使用率之间的绝对差异着色。绝对差异和占总数百分比的差异都在工具提示中报告。
此处记录了火焰图的高级概述。
(披露:我在谷歌从事Stackdriver Profiler的工作(