单核速度是否受益于巨大的 L3 缓存?



假设我有一个 32 个内核的 CPU 和一个巨大的 120 MB 三级缓存。如果我运行一些仅在一个内核上执行的内存密集型代码,那么该单个内核是否可以从整个 L3 缓存中受益?据我所知,L3 在大多数现代 x86 CPU 的内核之间共享......

所以我会说是的,它从中受益,但我不确定......这意味着拥有许多具有巨大 L3 缓存的核心 CPU 实际上会加快某些内存密集型工作负载的单核执行速度。

在 AMD Zen 上,不,每个 4 核的 CCX(核心集群(都有自己的私有 L3,独立于其他 CCX 中的 L3。

在英特尔 CPU 上,是的。 L3 由插槽/封装中的所有内核共享。 拥有大量内核,每个内核都有自己的 L3 切片将意味着更大的环形总线或网状网络,以及 L3 的更高延迟,但容量更好。

如果 L3 的 8MiB 足以满足来自某个单线程程序的大部分访问,那么它在四核"客户端"i7 芯片上的运行速度可能比具有 32 个内核的大型至强更快,假设两者都以相同的时钟速度运行。 相关:为什么Skylake在单线程内存吞吐量方面比Broadwell-E好得多?

最新更新