我在一台有 2 个节点的 NUMA 机器上工作。我正在尝试分析代码以测量对远程内存的内存访问百分比。
我的机器是AMD英特拉格斯(家庭15h)。Linux 3.9 中引入了 Perf 支持,但我在升级到 3.8 之后的内核版本时遇到了问题,所以目前我正在寻找替代方案。
我看过PAPI,但不知道如何使用本机事件。
试试 LIKWID。它带有一个包装工具likwid-perfctr
- 只需在其控制下运行代码即可。MEM
组计数器是您需要的:
likwid-perfctr -C 0-11 -g MEM ./executable
这将测量在 0 到 11 的内核上使用性能计数器。根据您的具体情况进行调整。