将非常大的 int 转换为双倍,在某些计算机上会损失精度



我目前正在学习 cpp 中的类型间数据转换。我被教导说

对于

一个非常大的整数,我们可能会(对于某些计算机(遭受 转换为双精度时的精度。

但没有为该声明提供任何理由。

有人可以提供解释和示例吗?谢谢

假设浮点数使用 N 位存储。

现在,让我们假设这个浮点数可以精确地表示所有可以用 N 位的整数类型表示的整数。由于 N 位整数要求其所有 N 位表示其所有值,因此对此浮点的要求也是如此。

浮点数应该能够表示小数。但是,由于所有位都用于表示整数,因此剩余的位为零位来表示任何小数。这是一个矛盾,我们必须得出结论,浮点数可以精确地将所有整数表示为大小相等的整数类型的假设一定是错误的。

由于在 N位整数的范围内必须存在不可表示的整数,因此,如果转换后的值恰好是不可表示的值之一,则将该整数转换为 N 位浮点数可能会失去精度。


现在,由于浮点数可以表示有理数的子集,因此其中一些可表示的值可能确实是整数。特别是,IEEE-754规范保证二进制双精度浮点可以表示最大为253的所有整数。此属性与尾数的长度直接相关。

因此,在符合 IEEE-754 的系统上转换为双精度时,不可能失去 32 位整数的精度。


从技术上讲,x86 体系结构的浮点单元实际上使用 80 位扩展浮点格式,该格式旨在能够精确地表示所有 64 位整数,并且可以使用long double类型进行访问。

如果int是 64 位,double也是 64 位,则可能会发生这种情况。浮点数由尾数(表示数字(和指数组成。由于在这种情况下double的尾数比int少,那么双数能够表示更少的数字,并且会发生精度损失。

最新更新