我有一个大小为 (91716x91716) 的稀疏矩阵 A,其中包含 3096684 个非零元素和一个密集的向量 rhs。我用共轭梯度以这种方式求解系统:
initParallel();
ConjugateGradient<SparseMatrix<double>, Lower|Upper> solver;
solver.compute(A);
const VectorXd response = solver.solve(rhs);
我正在编译:
g++ -O3 -I./eigen -fopenmp -msse2 -DEIGEN_TEST_SSE=ON -o example example.cpp
执行,无论是多线程还是非多线程,执行时间大致相同(大约 1500 毫秒)。我正在使用特征版本 3.2.8。
多线程性能不佳有什么原因吗?我实际上在我的系统监视器中看不到多线程效果。还有其他方法可以加速这个过程吗?
编辑:对 Eigen::nbThreads() 的调用会响应 12 个线程。
3.2.8 版的文档
目前,以下算法可以利用多线程:通用矩阵 - 矩阵乘积,PartialPivLU
http://eigen.tuxfamily.org/dox/TopicMultiThreading.html
由于开发文档提到更多的算法正在使用多线程,您需要更改为 Eigen3.3-beta1 或开发分支以使用 ConjugateGradient 的并行版本。