Numbapro 是否支持 SIMD 编程架构?



我正在尝试使用单纯形优化来解决GPU上的熵问题。因为单纯形的每次迭代都依赖于前一次迭代,所以我相信我无法使我的算法并行。

然而,在对PyOpenCl和Numbapro进行了一些研究之后,OpenCl提供了一种称为SIMD的编程架构。我只是想知道 Numbapro 是否会提供相同的服务?

到目前为止,我已经尝试了jit,autojit和矢量化代码的某些部分,但没有性能提高的迹象。

是的,确实如此。

请在 https://developer.nvidia.com/how-to-cuda-python 观看视频 - 它准确地显示了您感兴趣的内容。

最新更新