如何将所有内存分配限制为一个 NUMA 节点

我是 NUMA 感知多线程编程的新手。我正在编写我的代码，以便所有线程及其内存分配都限制在一个节点上。在程序开始时，我进行以下调用：

struct bitmask *bm = numa_parse_nodestring("0");
if (bm == 0) {
    exit(1);
}
numa_bind(bm);

我的理解是，以这种方式调用numa_bind会将所有线程和所有内存分配绑定到节点 0。

此外，当我从此代码启动 pthreads 时，我使用以下方法将它们绑定到特定的 CPU：

pthread_setaffinity_n

但是，当我查看/proc//numa_maps 时，我仍然可以看到某些库（例如 libc）绑定到节点 1 上的内存。如何确保进程所需的所有内存都绑定到节点 0？

像libc这样的共享库不能绑定到进程/应用程序指定的内存库。请参阅共享库-numa

代码往往会缓存在本地处理器的 L3 缓存中。由于它是只读的，因此一旦加载到缓存中，就不太可能生成任何流量。我不会太在意它，除非你有分析信息显示它确实会带来问题。

相关内容