英特尔应用:如何从整数模式转换到浮点模式

我知道当应用程序想要执行浮点操作时，必须将英特尔处理器配置为在浮点模式下工作。每次我需要执行浮点操作时，更改模式是不是太昂贵了?谁负责做这个"模式改变":编译器还是操作系统?考虑到浮点寄存器与整数寄存器分开，为什么FPU并不总是准备好工作?

这不是一个整数与FP模式，只有x87和SSE控制寄存器位，使任何FP指令错误。(或MMX或XMM regs中的整数SIMD)。

现在大多数进程都在使用XMM regs，例如，即使对于内存，和"急切"。上下文切换上的FPU保存策略更有意义，在切换到新的用户空间任务之前，总是保存/恢复FP/SIMD寄存器。(特别是当负载/存储吞吐量相对于中断开销有所改善时。)进入内核进行系统调用或中断仍然只保存GP整数寄存器，但是内核避免使用FP指令本身，而不会触发可能不干净的用户空间状态的保存。(所以它是昂贵的，只有少数情况下，如RAID5/RAID6和加密驱动程序可以这样做。)

旧的Linux内核使用"lazy"FPU储蓄在上下文切换时清除这些位，这样任何这样的指令都会出错，希望被切换到的新任务能够在没有出错的情况下结束它的时间片。在这种情况下，FP/SIMD寄存器可以保持不变，使用最后运行FP/SIMD指令的用户空间任务的值。

该故障机制允许内核介入并保存旧的FP寄存器，然后使用恢复的FP寄存器恢复当前任务。但是，一旦完成了FP/SIMD上下文切换，以后的指令就可以在其时间片的剩余时间内执行而不会出错。

热心保存/恢复是几年前的默认设置，而"懒惰"mode已经从Linux源代码树中完全移除。同样，因为中断在深度流水线的OoO执行cpu上非常昂贵，并且因为在给定当前缓存/内存带宽的情况下保存/恢复FP regs并不那么昂贵。

顺便说一句，你在问题中的描述(除了你的评论)听起来可能是在使用x87指令之前需要在MMX整数simd之后需要emms。

这就是为什么MMX几乎从不使用的几个原因之一，而是使用没有这个问题的SSE2。(x87本身几乎从不在64位代码中使用，再次支持SSE2寄存器中的标量操作，使用平面寄存器文件而不是堆栈。)

相关内容

最新更新

热门标签：