所以cufftComplex
类型是一个数组,其中包含n
结构,带有x
和y
-字段,分别表示每个复数的实部和虚部。
另一方面,如果我想在 OpenGL 中创建一个具有x-
和y-
字段的顶点缓冲区对象,即 2D 顶点或只是一个也表示n
复数的顶点缓冲区对象,我必须创建一个2n
大小的浮点数组,布局如下:
x0 y0 | x1 y1 | ... | xn yn
然后,我通过调用将其写入 VBO:
glBufferData(GL_ARRAY_BUFFER, n * sizeof(GLfloat), complex_values_array, GL_DYNAMIC_DRAW);
我想用cuFFT对图像进行傅里叶变换,并显示例如复数值的大小。如何解决两种数据类型之间的这种不兼容性?cuFFT有没有办法对VBO采取行动?
编辑:
也许我应该写一个 CUDA 内核,它采用 cufftComplex 类型并将每个复数的大小映射到 1D-VBO。或者将cufftComplex类型映射到2D-VBO的CUDA内核。我不知道开销是多少,因为它是设备>设备,我希望它是可管理的。
我设法通过编写内核来解决此问题,如下所示:
__global__ void cufftComplex2Float(float* vbo_magnitude, Complex *z, const int width, const int height){
unsigned int i = blockIdx.x*blockDim.x + threadIdx.x;
unsigned int j = blockIdx.y*blockDim.y + threadIdx.y;
float magnitude = pow(z[j*height + i].x, (float)2) + pow(z[j*height + i].y, (float)2);
vbo_magnitude[j*height + i] = (PI2 + atanf(sqrt(0.1*magnitude))) / PI;
};
它不涉及主机设备传输,因此非常快。