将SSE内部函数转换为可读的C/C++代码



我继承了一些高度优化(SSE4)但未注释的c代码。是否有任何工具或实用程序可以将SSE内部代码转换为可读性更强的代码或伪代码?这主要是为了可读性,这样我就可以在深入研究和进行更改之前更好地理解代码。

我不知道有这样的工具。

但无论如何,这很可能不会有多大帮助。如果SSE代码优化得很好,那么最困难的部分可能不是解码内部函数。困难的部分是遵循所有技巧来提高局部性并消除迭代内数据依赖性(条带挖掘、多面体循环转换等)

不过,我可以给你一个建议:始终以最简单的方式编写同一例程的注释良好的标量版本。这个"参考代码"应该只关心可读性和正确性,而不是速度。。。因此,它应该有很多断言。还有一个测试套件,可以同时使用标量版本和优化的变体。

无论是第一次实现例程,还是更新现有例程,都要从参考代码和测试套件开始。不一定按这个顺序。

这种方法前期成本更高,但从长远来看要便宜得多。

最新更新