我正在编写一个程序,其中进程0将图像的部分发送给其他进程,这些进程转换(长操作)这部分并发送回秩0。我有一个问题。为了重现我的问题,我写了一个简单的例子。一个512x512px大小的图像被进程0分割成4部分(垂直条纹)。接下来,其他进程将此部分保存到磁盘上。问题是,每个过程保存相同的部分。我发现图像是正确分割的部分,但问题可能是发送数据。我的代码有什么问题?
运行:mpirun -np 5 ./example
主:int main(int argc, char **argv) {
int size, rank;
MPI_Request send_request, rec_request;
MPI_Status status;
ostringstream s;
MPI_Init(&argc, &argv);
MPI_Comm_rank(MPI_COMM_WORLD, &rank);
MPI_Comm_size(MPI_COMM_WORLD, &size);
if (rank == 0) {
Mat mat = imread("/home/user/original.jpg", CV_LOAD_IMAGE_COLOR);
if (!mat.data) exit(-1);
int idx = 1;
for (int c = 0; c < 512; c += 128) {
Mat slice = mat(Rect(c, 0, 128, 512)).clone();
MPI_Isend(slice.data, 128 * 512 * 3, MPI_BYTE, idx, 0, MPI_COMM_WORLD, &send_request);
idx++;
}
}
if (rank != 0) {
Mat test = Mat(512, 128, CV_8UC3);
MPI_Irecv(test.data, 128 * 512 * 3, MPI_BYTE, 0, 0, MPI_COMM_WORLD, &rec_request);
MPI_Wait(&rec_request, &status);
s << "/home/user/p" << rank << ".jpg";
imwrite(s.str(), test);
}
MPI_Finalize();
return 0;
}
如果坚持使用非阻塞操作,那么同时发出多个操作的正确方法是:
MPI_Request *send_reqs = new MPI_Request[4];
int idx = 1;
for (int c = 0; c < 512; c += 128) {
Mat slice = mat(Rect(c, 0, 128, 512)).clone();
MPI_Isend(slice.data, 128 * 512 * 3, MPI_BYTE, idx, 0, MPI_COMM_WORLD, &send_reqs[idx-1]);
idx++;
}
MPI_Waitall(4, send_reqs, MPI_STATUSES_IGNORE);
delete [] send_reqs;
另一个(和IMHO更好)的选择是利用MPI_Scatterv
分散原始数据缓冲区。因此,您甚至可以节省克隆图像矩阵的部分。
if (rank == 0) {
Mat mat = imread("/home/user/original.jpg", CV_LOAD_IMAGE_COLOR);
if (!mat.data) exit(-1);
int *send_counts = new int[size];
int *displacements = new int[size];
// The following calculations assume row-major storage
for (int i = 0; i < size; i++) {
send_counts[i] = displacements[i] = 0;
}
int idx = 1;
for (int c = 0; c < 512; c += 128) {
displacements[idx] = displacements[idx-1] + send_counts[idx-1];
send_counts[idx] = 128 * 512 * 3;
idx++;
}
MPI_Scatterv(mat.data, send_counts, displacements, MPI_BYTE,
NULL, 0, MPI_BYTE, 0, MPI_COMM_WORLD);
delete [] send_counts;
delete [] displacements;
}
if (1 <= rank && rank <= 4) {
Mat test = Mat(512, 128, CV_8UC3);
MPI_Scatterv(NULL, NULL, NULL, MPI_BYTE,
test.data, 128 * 512 * 3, MPI_BYTE, 0, MPI_COMM_WORLD);
s << "/home/user/p" << rank << ".jpg";
imwrite(s.str(), test);
}
注意MPI_Scatterv
的参数是如何准备的。由于您仅散射到4个MPI进程,因此将send_counts[]
的某些元素设置为零可以使程序正确运行超过5个MPI进程。此外,原始代码中的根秩不会发送给自己,因此send_counts[0]
必须为零。
问题是,在矩阵Mat
被销毁之前,您没有等到发送操作完成。使用MPI_Send
代替MPI_Isend
。
如果你真的想使用非阻塞通信,你必须跟踪所有的MPI_Request对象和所有的Mat
图像,直到发送完成。