我遇到过这个问题。在使用WebCL、CUDA或OpenCL计算分形时,我需要比较CPU和GPU的性能。我该怎么做呢?
谢谢。
您可以计算运行固定次数的迭代所花费的时间,或者度量在固定时间内完成了多少次迭代。
或者你可以做一些更花哨的事情,比如做固定数量的工作,但如果它完成得太快,时间不精确相对来说太大,那么将工作增加一倍并重复。
在任何情况下,您可以这样计算吞吐量:
work_done / time_needed