G++:优化 -march=haswell 和更新的变化数值结果

我一直在努力优化性能，当然也做回归测试，当我注意到 g++ 似乎会根据所选的优化改变结果时。到目前为止，我认为无论选择哪种架构，-O2 -march=[whatever]都应该为数值计算产生完全相同的结果。然而，对于 g++ 来说，情况似乎并非如此。虽然使用旧架构到 ivybridge 会产生与 clang 对任何架构相同的结果，但我对 gcc 的 haswell 和更新得到不同的结果。这是 gcc 中的错误还是我对优化误解了某些内容？我真的很吃惊，因为叮当似乎没有表现出这种行为。

请注意，我很清楚差异在机器精度范围内，但它们仍然干扰我的简单回归检查。

下面是一些示例代码：

#include <iostream>
#include <armadillo>
int main(){
arma::arma_rng::set_seed(3);
arma::sp_cx_mat A = arma::sprandn<arma::sp_cx_mat>(20,20, 0.1);
arma::sp_cx_mat B = A + A.t();
arma::cx_vec eig;
arma::eigs_gen(eig, B, 1, "lm", 0.001);
std::cout << "eigenvalue: " << eig << std::endl;
}

编译使用：

g++ -march=[architecture] -std=c++14 -O2 -o test example.cpp -larmadillo

GCC 版本：6.2.1

CLANG 版本：3.8.0

编译为 64 位，在英特尔 Skylake 处理器上执行。

这是因为 GCC 默认使用融合-乘-加 (fma( 指令(如果可用(。相反，Clang 默认不使用它们，即使它可用。

无论是否使用 fma，a*b+c的结果都可能不同，这就是为什么当您使用-march=haswell时，您会得到不同的结果(Haswell 是第一个支持 fma 的英特尔 CPU(。

您可以决定是否要将此功能与-ffp-contract=XXX一起使用。

-ffp-contract=off，您不会得到FMA指令。
-ffp-contract=on，你会得到FMA指令，但只有在语言标准允许的情况下才会收缩。在当前版本的 GCC 中，这意味着关闭(因为它尚未实现(。
-ffp-contract=fast(这是 GCC 默认值(，您将获得 fma 入侵。

相关内容

最新更新

热门标签：