我想在算法的每次迭代中求解 10 个线性系统 (Ax = b(。
每个系统的 A 约为 10 x 11(超定(。
CPU 有 8 个内核。
如果我让每个 CPU 解决 10 个线性系统中的一个,6 个 CPU 必须等待解决最后 2 个系统。
如果我用多线程求解器逐个求解每个系统,性能会很差吗?我担心错误共享,因为矩阵 A 很小。
对于这种情况,本征是否有多线程求解器?
再次感谢。
试图在这种小问题(10 x 11
(中利用多线程只会减慢速度。如果您想做得比并行运行 10 个求解更好,请尝试在管道中查找更多并行任务。