我得到一个令人困惑的结果与浮点数做数学。我的代码永远不会产生一个负数产生一个负数,当我试图取平方根时,这会导致nan。
这段代码在测试中似乎运行得很好。然而,当对现实世界(即可能非常小,7和8负指数)的数字进行操作时,总和最终变为负值,从而导致nan。理论上,减法步骤只删除已经添加到sum
的数字;这是一个浮点错误问题吗?有什么办法能修好它吗?
代码:
public static float[] getRmsFast(float[] data, int halfWindow) {
int n = data.length;
float[] result = new float[n];
float sum = 0.000000000f;
for (int i=0; i<2*halfWindow; i++) {
float d = data[i];
sum += d * d;
}
result[halfWindow] = calcRms(halfWindow, sum);
for (int i=halfWindow+1; i<n-halfWindow; i++) {
float oldValue = data[i-halfWindow-1];
float newValue = data[i+halfWindow-1];
sum -= (oldValue*oldValue);
sum += (newValue*newValue);
float rms = calcRms(halfWindow, sum);
result[i] = rms;
}
return result;
}
private static float calcRms(int halfWindow, float sum) {
return (float) Math.sqrt(sum / (2*halfWindow));
}
一些背景:我试图优化一个函数,计算信号数据上的滚动均方根(RMS)函数。优化是非常重要的;这是我们加工过程中的一个热点。基本方程很简单- http://en.wikipedia.org/wiki/Root_mean_square -将窗口上的数据的平方相加,将总和除以窗口的大小,然后取平方。
原始代码:
public static float[] getRms(float[] data, int halfWindow) {
int n = data.length;
float[] result = new float[n];
for (int i=halfWindow; i < n - halfWindow; i++) {
float sum = 0;
for (int j = -halfWindow; j < halfWindow; j++) {
sum += (data[i + j] * data[i + j]);
}
result[i] = calcRms(halfWindow, sum);
}
return result;
}
这段代码很慢,因为它在每一步都从数组中读取整个窗口,而不是利用窗口中的重叠。预期的优化是通过删除最老的值并添加最新的值来使用这种重叠。
我已经非常仔细地检查了新版本中的数组索引。它似乎是工作的预期,但我肯定是错的,在这方面!
更新:根据我们的数据,将sum
类型更改为double类型就足够了。不知道我怎么就没想到。但我留下了否定支票。顺便说一句,我也能够实现一个算法,每400个样本重新计算一次和,这样可以获得很好的运行时间和足够的准确性。谢谢。
这是浮点错误问题吗?
是的。由于四舍五入,您很可能在减去前一个求和后得到负值。
例如: float sum = 0f;
sum += 1e10;
sum += 1e-10;
sum -= 1e10;
sum -= 1e-10;
System.out.println(sum);
在我的机器上,这打印
-1.0E-10
即使在数学上,结果是零。
这是浮点数的本质:1e10f + 1e-10f
与1e10f
给出完全相同的值。
就缓解策略而言:
- 您可以使用
double
代替float
来提高精度。 - 有时,你可以完全重新计算平方和,以减少舍入误差的影响。
- 当总和为负时,您可以像上面(2)那样进行完全重新计算,或者简单地将总和设置为零。后者是安全的,因为你知道你将把总和推向它的真实值,而不会偏离它。
尝试在第二个循环中检查索引。i
的最后一个值是n-halfWindow-1
, n-halfWindow-1+halfWindow-1
的最后一个值是n-2
。
您可能需要将循环更改为for (int i=halfWindow+1; i<n-halfWindow+1; i++)
您正在遇到浮点数的问题,因为您认为它们就像数学上的实数。它们不是,它们是实数的近似值,映射成离散数,并在混合中添加了一些特殊规则。
如果你打算经常使用浮点数,花点时间阅读一下每个程序员都应该知道的关于浮点数的知识。如果不小心浮点数和实数之间的差异,可能会反过来以最糟糕的方式伤害你。
或者,只要相信我的话,知道每个浮点数都"非常接近"所请求的值,有些是"完全"准确的,但大多数是"大部分"准确的。这意味着您需要考虑测量误差,并在计算之后记住它,否则您可能会认为在值的计算结束时您有一个确切的结果(实际上您没有)。