OpenCL编译器选项-cl-fast-relaxed-math
的作用是什么?
从阅读文档来看,-cl-fast-relaxed-math
似乎允许内核对任何变量进行浮点运算,即使这些变量指向错误的数据类型、导致被零除或其他一些非法行为。
这是正确的吗?这个编译器选项在什么情况下有用?
来自注释:
仅启用-cl有限数学和-cl不安全数学优化。这两个选项通过删除对输入值的一些检查来提供可选的速度。IE:不检查NaN编号。然而,如果输入值碰巧是非正态数,则结果未知DarkZeros