您能展示如何使用CUDA计算可以驻留在特定GPU中的最大线程数吗?也就是说,我可以分配给内核的最大线程数。谢谢
您可以使用cudaGetDeviceProperties()
获得每个多处理器(SM)的最大线程数。然后将其乘以您卡中的SM数量。
尽管这并不一定意味着你应该执行这个数量的线程。请参阅此SO答案以获得良好的解释。