我正在尝试使用eigen加速矢量规范的计算。
尝试以两种方式进行操作:
方式1:将向量分别存储在数组(std :: vector(
std::vector<Eigen::Matrix<double, 1, VECTOR_SIZE>> my_vectors(num_vectors);
Eigen::Matrix<double, Eigen::Dynamic, 1> norms(num_vectors, 1);
for (int i = 0 ; i < my_vectors.size() ; i++) {
norms(i, 0) = my_vectors[i].norm();
}
方式2:将向量存储为同一矩阵的行并使用Rowwise Norm
Eigen::Matrix<double, Eigen::Dynamic, VECTOR_SIZE> my_vectors(num_vectors, VECTOR_SIZE);
Eigen::Matrix<double, Eigen::Dynamic, 1> norms = my_vectors.rowwise().norm();
我很惊讶地看到, Way1 的速度很慢, Way2 甚至更慢。
我做错了什么吗?有没有办法更快地计算规范?
在我进行的另一项测试中,矢量减法也是如此。在单独的矢量上进行的迭代比将所有向量存储为矩阵行并使用.rowwise() - vector_to_subtract
来自https://eigen.tuxfamily.org/dox/group__topicstorageorders.html
如果未指定存储订单,则eigen默认将其存储在列中。如果使用便利性Typedef(Matrix3f,arrayxxd等(之一。
我最好的猜测是内存访问问题:rowwise()
可能在内存中进行了一堆"跳过",即不读取连续区域 - 而单独存储每行不会遇到此问题。
警告:当我以最好的意图写下答案时,我无法自己测试,显然它会进一步放慢速度。感谢您测试这个想法。