IEEE754 单个精度 - 表示数字一半的常规算法



假设 N 是根据单精度标准表示IEEE754任意数字。我想在IEEE754再次找到 N/2 的最精确表示。

我想找到一个通用算法(用文字描述,我只想考虑必要的步骤和案例(来获得表示。

我的方法是:

假设数字表示:b0_b1_b2_b3...b_34

  1. 隔离确定数字符号 (-/+( 的第一个位。
  2. 根据无符号表示b_1...b_11计算幂 (p( 的表示。
  3. 如果power = 128我们有一个特例。如果尾数的所有位都等于 0,则根据b_0,我们有负或加无穷大。我们不会改变任何东西。如果尾数至少有一位等于 1,那么我们就NaN值。同样,我们什么也没改变。
  4. 如果e is inside]-126,127[then we have a normalized mantissam。新的幂p can be calculated asp' = p - 1and belongs in the interval]-127, 126]. We then calculatem/2' 我们从右边开始表示它,并丢失任何不能包含在尾数 23 位中的位。
  5. 如果e = -126,那么在计算这个数字的一半时,我们传递一个非规范化的尾数。我们代表p = 127,计算尾数的一半,然后从右边开始再次表示它,丢失任何无法包含的信息。
  6. 最后,如果e = -127我们有一个非规范化的尾数。只要m/2可以用尾数中可用的位数表示而不会丢失信息,我们就表示并保持p = -127。在任何其他情况下,我们将数字表示为正 0 或负 0,具体取决于b_0

我错过了什么步骤,可以进行的任何改进(我确信有(或任何看起来完全错误的事情?

我在 Java 中实现了除以二算法,并针对所有 32 位输入进行了验证。我试图遵循你的伪代码,但我有三个地方存在分歧。首先,无穷大/NaN 指数是 128。其次,在情况 4(正常 ->正常(中,无需对分数进行操作。第三,你没有描述当你对分数进行操作时,半圆是如何工作的。否则。

public final class FloatDivision {
public static float divideFloatByTwo(float value) {
int bits = Float.floatToIntBits(value);
int sign = bits >>> 31;
int biased_exponent = (bits >>> 23) & 0xff;
int exponent = biased_exponent - 127;
int fraction = bits & 0x7fffff;
if (exponent == 128) {
// value is NaN or infinity
} else if (exponent == -126) {
// value is normal, but result is subnormal
biased_exponent = 0;
fraction = divideNonNegativeIntByTwo(0x800000 | fraction);
} else if (exponent == -127) {
// value is subnormal or zero
fraction = divideNonNegativeIntByTwo(fraction);
} else {
// value and result are normal
biased_exponent--;
}
return Float.intBitsToFloat((sign << 31) | (biased_exponent << 23) | fraction);
}
private static int divideNonNegativeIntByTwo(int value) {
// round half to even
return (value >>> 1) + ((value >>> 1) & value & 1);
}
public static void main(String[] args) {
int bits = Integer.MIN_VALUE;
do {
if (bits % 0x800000 == 0) {
System.out.println(bits);
}
float value = Float.intBitsToFloat(bits);
if (Float.floatToIntBits(divideFloatByTwo(value)) != Float.floatToIntBits(value / 2)) {
System.err.println(bits);
break;
}
} while (++bits != Integer.MIN_VALUE);
}
}

最新更新