我应该为perf的-e选项使用哪个事件来获取函数分支事件



我目前在我的Nexus 5上使用simpleperf,这是Android的perf移植版本。我希望做的是动态地获得本机函数的执行顺序。

我想应该有一种方法来转储一个样本记录,一旦有一个分支事件。所以我要做的就是执行simpleperf record -e branch-loads:u -p [pid]

下面我列出了我的设备支持的一些相关事件。为了我的目的,我尝试了branch-loadsbranch-instructions。但他们都没有得到预期的结果。我相信这是由于分支包含函数以及条件跳转。

root@hammerhead:/data/local/tmp # ./simpleperf32 list                          
List of hw-cache events:
  ...
  branch-loads
  branch-load-misses
  branch-stores
  branch-store-misses
  node-loads
  node-load-misses
  node-stores
  node-store-misses
  node-prefetches
  node-prefetch-misses
List of hardware events:
  cpu-cycles
  instructions
  branch-instructions
  branch-misses
  bus-cycles
  stalled-cycles-frontend
  stalled-cycles-backend

所以,我怎么能得到函数调用事件?或者如果我走错了路,请给我指出正确的路。谢谢。

perf list没有列出实际的硬件事件,它只是一个性能预定义列表的列表,并且它不被任何CPU完全支持。有些cpu将多个事件映射到perf的预定义事件集,其他cpu映射不同的事件集。

您应该检查CPU核心(qualcomm krait 400)的文档,以找到实际的硬件性能监控事件(计数器)并将它们作为原始数据使用(在perf_attr中编码为perf stat -e rXXXX或raw也是特定于体系结构的)。您也可以尝试perf stat/perf stat -d来检查从一些默认列表中计数(支持)哪些事件。

你的nexus 5是基于Krait 400 CPU核心。

在krait中报告了一些问题:如何在krait CPU下获得2nd Nexus7的perf_event结果还有一个补丁的链接,定义了krait的标准事件:

850329年http://www.serverphorums.com/read.php?12

从预定义的性能到实际的hw事件有两组映射。一个支持branch-instructions事件,另一个不支持:

/*
+ * Krait HW events mapping
+ */
+static const unsigned krait_perf_map[PERF_COUNT_HW_MAX] = {
+ [PERF_COUNT_HW_CPU_CYCLES] = ARMV7_PERFCTR_CPU_CYCLES,
+ [PERF_COUNT_HW_INSTRUCTIONS] = ARMV7_PERFCTR_INSTR_EXECUTED,
+ [PERF_COUNT_HW_CACHE_REFERENCES] = HW_OP_UNSUPPORTED,
+ [PERF_COUNT_HW_CACHE_MISSES] = HW_OP_UNSUPPORTED,
+ [PERF_COUNT_HW_BRANCH_INSTRUCTIONS] = ARMV7_PERFCTR_PC_WRITE,
+ [PERF_COUNT_HW_BRANCH_MISSES] = ARMV7_PERFCTR_PC_BRANCH_MIS_PRED,
+ [PERF_COUNT_HW_BUS_CYCLES] = ARMV7_PERFCTR_CLOCK_CYCLES,
+};
+
+static const unsigned krait_perf_map_no_branch[PERF_COUNT_HW_MAX] = {
+ [PERF_COUNT_HW_CPU_CYCLES] = ARMV7_PERFCTR_CPU_CYCLES,
+ [PERF_COUNT_HW_INSTRUCTIONS] = ARMV7_PERFCTR_INSTR_EXECUTED,
+ [PERF_COUNT_HW_CACHE_REFERENCES] = HW_OP_UNSUPPORTED,
+ [PERF_COUNT_HW_CACHE_MISSES] = HW_OP_UNSUPPORTED,
+ [PERF_COUNT_HW_BRANCH_INSTRUCTIONS] = HW_OP_UNSUPPORTED,
+ [PERF_COUNT_HW_BRANCH_MISSES] = ARMV7_PERFCTR_PC_BRANCH_MIS_PRED,
+ [PERF_COUNT_HW_BUS_CYCLES] = ARMV7_PERFCTR_CLOCK_CYCLES,
+};

根据选择代码,这是Krait CPU后续版本的特性:

+static int krait_pmu_init(struct arm_pmu *cpu_pmu)
+{
+ u32 id = read_cpuid_id() & 0xffffff00;
+
+ armv7pmu_init(cpu_pmu);
+ cpu_pmu->name = "ARMv7 Krait";
+ /* Some early versions of Krait don't support PC write events */
+ if (id == 0x511f0400 || id == 0x510f0600)
+ cpu_pmu->map_event = krait_map_event_no_branch;
+ else
+ cpu_pmu->map_event = krait_map_event;
+ cpu_pmu->num_events = armv7_read_num_pmnc_events();
+ cpu_pmu->set_event_filter = armv7pmu_set_event_filter;
+ return 0;
+}

由于我可以解码cpu - Krait 400和Krait 600不支持分支指令PMU事件(PC写事件)。

更新:对于你的Nexus 5x,如果它使用ARM Cortex A57内核,有一个原始事件列表,基于"表11-24"从"Cortex A57技术参考手册"

https://sourceforge.net/p/perfmon2/libpfm4/ci/master/tree/lib/events/arm_cortex_a57_events.h

仍然没有所有分支的计数器。有BRANCH_MISPRED &;BRANCH_PRED,但我没有访问文档,不知道他们是否会计算所有分支

最新更新