我必须生成一个复值的多维数组N (j, k, m, l)
,大约为10*100*100*1000。
我想做以下操作来计算这个N并返回。
for j<10 ...
{
for k<100 ...
{
......
some matrix multiplication to generate a 2D complex valued matrix n(100*1000)
......
N(j,k,:,:)= n
}
}
我的问题:
如何有效地实现CCD_ 2。
对于目前的问题大小,我应该从头开始编码还是使用一些现有的库?
您所说的是10*100*100*1000=100000000个复数,如果是2个float
,每个可能为8字节,如果是两个doubles
,则为16字节,大约为800兆字节或1.6千兆字节。在普通台式电脑的容量范围内,这是一个良好的开端。
有效分配的主要内容是确保内存布局是这样的,即分配处理的是连续内存。您可以编写几个类来提供一个不错的接口,比如Matrix_2D
,然后是类似于的Matrix_4D
template <typename T>
class Matrix_4D
{
public:
Matrix_4D(size_t j, size_t k, size_t l, size_t m)
: j_(j), k_(k), l_(l), m_(m), data_(new T[j * k * l * m]),
klm_(k * l * m), lm_(l * m),
{ /* optionally, initialise elements */ }
~Matrix_4D() { delete data_; }
T& operator()(size_t j, size_t k, size_t l, size_t m)
{
return data_[j * klm_ + k * lm_ + l * m_ + m];
}
const T& operator()(size_t j, size_t k, size_t l, size_t m) const
{
return data_[j * klm_ + k * lm_ + l * m_ + m];
}
void set(size_t l, size_t m, const Matrix_2D& m2)
{
if (m2.j_ != l_ || m2.k_ != m_)
throw std::runtime_error("mismatched dimensions");
std::copy(m2.data_[0], m2.data_[lm_], (*this)(l, m, 0, 0));
}
private:
size_t j_, k_, l_, m_;
size_t klm_, lm_; // needed so often -> save
T* data_;
};
矩阵类应该是friend
s,这样它们就可以相互剥离数据。如果你想变得更花哨,你实际上可以提供一个代理对象-在Matrix_4D
中添加以下内容
struct Proxy_2D
{
Proxy_2D(Matrix_4D& m4, size_t l, size_t m) : m4_(m4), l_(l), m_(m) { }
Proxy_2D& operator=(const Matrix2D& m2)
{
m4_.set(l_, m_, m2);
return *this;
}
Matrix_4D& m4_;
size_t l_, m_;
};
Proxy_2D operator()(size_t l, size_t m) { return Proxy_2D(*this, l, m); }
然后你可以这样做:
Matrix_4D m4(10, 20, 30, 40);
Matrix_2D m2(30, 40);
... set stuff in m2 ...
m4(2, 4) = m2;
编辑:对于你评论中的代码m2= m2 * transpose(m2)
,如果你想追求这种自己动手的实现来学习C++,而不是使用模板表达式等高性能技术来获取现有的高效库(这太复杂了,无法在这里进行讨论),那么在Matrix_2D
:
Matrix_2D transpose() const
{
Matrix_2D result(m_, l_);
for (size_t l = 0; l < l_; ++l)
for (size_t m = 0; m < m_; ++m)
result(m, l)= (*this)(l, m);
return result;
}
Matrix_2D& operator+=(const Matrix_2D& rhs)
{
for (size_t l = 0; l < l_; ++l)
for (size_t m = 0; m < m_; ++m)
(*this)(l, m) += rhs(l, m);
return *this;
}
Matrix_2D operator+(const Matrix_2D& rhs) const
{
Matrix_2D result(*this); // copy *this
return result += rhs;
}
有趣的是,你也可以在不复制数据的情况下将转置作为矩阵的一种动态视角,但你需要确保底层矩阵对象的生命周期跨越转置对象的使用:
template <typename T>
class Transpose_2D
{
public:
Transpose_2D(Matrix_2D<T>& m) : m_(m) { }
T& operator()(size_t l, size_t m) { return m_(m, l); }
const T& operator()(size_t l, size_t m) const { return m_(m, l); }
private:
Matrix_2D<T>& m_;
};
相应地更改Matrix_2D加法函数签名允许使用该签名,例如:
template <typename U>
Matrix_2D& operator+=(const U& rhs)
...
然后你可以做:
m2 += Transpose_2D(m2);
而且它的效率相当高。