在问题中如何在pycuda内核中生成随机数?
#include <curand_kernel.h>
const int nstates = %(NGENERATORS)s;
__device__ curandState_t* states[nstates];
__global__ void initkernel(int seed)
{
int tidx = threadIdx.x + blockIdx.x * blockDim.x;
if (tidx < nstates) {
curandState_t* s = new curandState_t;
if (s != 0) {
curand_init(seed, tidx, 0, s);
}
states[tidx] = s;
}
}
__global__ void randfillkernel(float *values, int N)
{
int tidx = threadIdx.x + blockIdx.x * blockDim.x;
if (tidx < nstates) {
curandState_t s = *states[tidx];
for(int i=tidx; i < N; i += blockDim.x * gridDim.x) {
values[i] = curand_uniform(&s);
}
*states[tidx] = s;
}
}
使用此经典示例,激活的随机数发生器是什么(XORWOW
,MTGP32
,其他)?
如何从内核中更改随机数生成器?
curand设备API中的默认发电机是Xorwow,如
所定义typedef struct curandStateXORWOW curandState_t;
在设备API标头中。您可以通过将另一种状态类型替换为curandInit
调用来更改为另一个生成器。请注意,与默认值相比,某些发电机需要与curandInit
例程不同的参数。