c-使用MPI，当存在连续数组时，用户定义的数据类型是否无用

在我的程序中，我向其他处理器发送矩阵的一些行，我用C进行编码，我知道C是行主。矩阵被分配为1d数组。

matrixInArrayB = malloc(height * width * sizeof(int));
matrixB = malloc(height * sizeof(int*));
for (int y = 0; y < height; y++) {
matrixB[y] = &matrixInArrayB[y * width];
}

我用这种方式发送

MPI_Isend(&matrixB[0][0], width * height, MPI_INT, dest, tag,
MPI_COMM_WORLD, &requestesForB[k]);

如果我必须使用一些特定的数据类型来确保行的连续性，我的疑问是：

int MPI_Type_contiguous(int count,
MPI_Datatype oldtype,
MPI_Datatype *newtype)

不，如果你不想，你不需要定义自己的数据类型。但是，如果使用得当，它们会非常有用。

假设您有以下结构来描述矩阵，而不是指向数据行的指针数组：

typedef struct {
int      rows;
int      cols;
ssize_t  rowstep;
ssize_t  colstep;
int     *data;
} matrix;

其中矩阵m的行r、列c上的数据元素是m.data[r*rowstep + c*colstep]。我在这个答案中概述了这个结构的一个更好的版本。

然后，您可以使用MPI_Type_create_hvector()创建与此特定类型矩阵(特定大小和步长(的行、列或主对角线相对应的类型：

int  n = (m.rows <= m.cols) ? m.rows : m.cols; /* min(m.rows, m.cols) */
MPI_Type_create_hvector(m.rows, 1, m.rowstep * sizeof m.data[0],
MPI_INT, &row_vector_type);
MPI_Type_create_hvector(m.cols, 1, m.colstep * sizeof m.data[0],
MPI_INT, &col_vector_type);
MPI_Type_create_hvector(n, 1, (m.rowstep + m.colstep) * sizeof m.data[0],
MPI_INT, &diag_vector_type);

要引用r行，请使用m.data + r*m.rowstep
要引用列c，请使用m.data + c*m.colstep
要引用主对角线，请使用m.data
大小字段始终为1，因为您发送/接收单独的行或列。

也可以定义与矩阵的任何连续矩形部分相对应的数据类型。

MPI库将在发送时收集数据，并在接收时分散数据。实际数据项在内存中不需要是连续的。

在上面的例子中，可以使用相同的代码来发送和接收任何行、列或对角向量。使用自定义数据类型，除了如上所示定义类型之外，不需要区分它们。

简化代码往往会产生更健壮的代码，错误更少。(你可以说bug要么是一种类型的，即很难发现但并不复杂，要么是复杂类型的，代码的不同方面以意外或无意的方式交互导致bug。(

因此，我想说，即使数据在连续数组中，用户定义的MPI数据类型也不是无用的，因为它们可以用来简化代码，从而使其更加健壮和易于维护。

显然，并不是所有的MPI代码都能很好地使用用户定义的MPI数据类型。尽可能使用用户定义的数据类型绝对不是解决方案。

我的观点是，您可以根据具体情况来确定有用性，这取决于您是否可以使代码更简单、更易于阅读和健壮。

相关内容

最新更新

热门标签：