根据该值,我们可以推断它使用与双精度浮点硬件相同的组件。但是double有53位有效位,那么为什么AVX512-IFMA被限制为52位呢?当然,尾数只有52位,其中一位被隐藏,但它仍然对值有贡献,需要输入加法器/乘法器/除法器。。。
IEEE-754双精度实际上只有52个显式存储位,第53位(最高有效位)是隐式1。
它利用DPF算术单元和FMA来实现快速的多精度乘法,有关详细信息,请参阅本文的第一节:在GPU 上使用双精度浮点算法实现更快的模幂运算
正如本文所介绍的,它在dpf乘法单元上进行乘法运算,如果操作数采样为53位,则会分解统一的处理步骤。